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本 书 揭示 现代 计算 机 的 内 部 工作 方式 ， 采 用 大 量 真实 的 例子 ， 引 导读 者 逐步 由 浅 入 深 地 学 
习 计算 机 体系 结构 。 本 书 内 容 经 过 精心 组 织 ， 层 次 分 明 ， 内 容 翔 实 。 对 计算 机 硬件 没有 预备 知 
识 的 要 求 ， 非 常 适合 于 大 学 本 科 的 教学 。 本 书 还 设计 大 量 难度 不 同 的 习题 ， 帮 助 读 者 更 好 地 理 
解 计算 机 工作 原理 。 


为 配合 本 书 的 教学 ， 作 者 将 大 量 资源 和 习题 收录 在 http://computerscience.jbpub.com/ECOA 
网 站 上 ， 供 读者 参考 ， 也 可 登录 华章 网 站 下 载 。 
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本 书 系统 介绍 计算 机 组 成 与 体系 结构 ， 主 要 内 容 包括 : 数字 逻辑 和 数字 系统 、 机 器 层 
次 的 数据 表示 方法 、 汇 编 层 次 的 机 器 组 织 和 结构、 存储 器 的 组 成 和 结构 、 接 口 和 通信 、 功 
能 组 织 、 多 处 理 器 和 可 供 选 择 的 其 他 结构 、 性 能 增强 、 网 络 结构 和 分 布 式 计算 机 系统 等 。 
本 书 把 计算 机 科学 技术 与 实际 问题 相 结 合 ， 用 大 景 精致 图 片 展示 计算 机 内 部 结构 ， 结 构 清 
晰 ， 内 容 翔 实 ， 还 包括 大 量 补充 材料 和 习题 ,方便 教学 。 

本 书 可 作为 高 等 院 校 计算 机 及 相关 专业 本 科 生 的 教材 或 参考 书 ， 也 可 供 相 关 技 术 人 员 
才 。 
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出 版 者 的 话 


文艺 复兴 以 降 ， 源 远 流 长 的 科学 精神 和 逐步 形成 的 学 术 规 范 ， 使 西方 国家 在 自然 科学 的 
各 个 领域 取得 了 垄断 性 的 优势 ， 也 正 是 这 样 的 传统 ， 使 美国 在 信息 技术 发 展 的 六 十 多 年 间 名 
家 辈出 、 独 领 风 骚 。 在 商业 化 的 进程 中 ， 美 国 的 产业 界 与 教育 界 越 来 越 紧 窗 地 结合 ， 计 算 机 
学 科 中 的 许多 泰山 北斗 同时 身 处 科研 和 教学 的 最 前 线 ， 由 此 而 产生 的 经 典 科学 著作 ， 不 仅 壁 
划 了 研究 的 范畴 ， 还 揭 更 了 学 术 的 源 变 ， 既 遵循 学 术 规 范 ， 又 自 有 学 者 个 性 ， 其 价值 并 不 会 
因 年 月 的 流逝 而 减退 。 

近年 ， 在 全 球 信息 化 大 讲 的 推动 下 ， 我 国 的 计算 机 产业 发 展 迅 猛 ， 对 专业 人 才 的 需求 日 
益 迫 切 。 这 对 计算 机 教育 界 和 出 版 界 都 既是 机 遇 ， 也 是 挑战 ; 而 专业 教材 的 建设 在 教育 战略 
上 显得 举足轻重 。 在 我 国信 息 技术 发 展 时 间 较 短 、 从 业 人 员 较 少 的 现状 下 ， 美 国 等 发 达 国 家 
在 其 计算 机 科学 发 展 的 几 十 年 间 积 淀 的 经 典 教材 仍 有 许多 值得 借鉴 之 处 。 因 此 ， 引 进 一 批 国 
外 优秀 计算 机 教材 将 对 我 国 计 算 机 教育 事业 的 发 展 起 积极 的 推动 作用 ， 也 是 与 世界 接轨 、 建 
设 真正 的 世界 一 流 大 学 的 必由之路 。 

机 械 工业 出 版 社 华章 图 文 信息 有 限 公司 较 早 意 识 到 “出 版 要 为 教育 服务 ”"。 自 1998 年 开始 ， 
华章 公司 就 将 工作 重点 放 在 了 六 选 、 移 译 国 外 优秀 教材 上 。 经 过 几 年 的 不 懈 努 力 ， 我 们 与 
Prentice Hall，Addison-Wesley，McGraw-Hill，Morgan Kaufmann 等 世界 著名 出 版 公司 建立 了 
良好 的 合作 关系 ， 从 它们 现 有 的 数 百 种 教材 中 甄选 出 Tanenbaum，Stroustrup，Kernighan， 
Jim Gray 等 大 师 名 家 的 一 批 经 典 作品 ， 以 “计算 机 科学 从 书 ” 为 总 称 出 版 ， 供 读者 学 习 、 研 
究 及 庚 藏 。 大 理 石 纹理 的 封面 ， 也 正体 现 了 这 套 丛书 的 品位 和 格调 。 

“计算 机 科学 丛书 ”的 出 版 工作 得 到 了 国内 外 学 者 的 昂 力 囊 助 ， 国 内 的 专家 不 仅 提供 了 中 
肯 的 选 题 指导 ， 还 不 辞 劳苦 地 担任 了 翻译 和 审 校 的 工作 ; 而 原 书 的 作者 也 相当 关注 其 作品 在 
中 国 的 传播 ， 有 的 还 专程 为 其 书 的 中 译本 作 序 。 记 今 ,“ 计 算 机 科学 丛书 ”已 经 出 版 了 近 百 个 
品种 ， 这 些 书 籍 在 读者 中 树立 了 良好 的 口碑 ， 并 被 许多 高 校 采 用 为 正式 教材 和 参考 书籍 ， 为 
进一步 推广 与 发 展 打下 了 坚实 的 基础 。 

随 着 学 科 建 设 的 初步 完善 和 教材 改革 的 逐渐 深化 ， 教 育 界 对 国外 计算 机 教材 的 需求 和 应 
用 都 步 人 一 个 新 的 阶段 。 为 此 ， 华 章 公司 将 加 大 引进 教材 的 力度 ， 在 “华章 教育 ”的 总 规划 
之 下 出 版 三 个 系列 的 计算 机 教材 : 除 “ 计 算 机 科学 丛书 ”之 外 ， 对 影印 版 的 教材 ， 则 单独 开 
膀 出 “经 典 原版 书库 ”; 同时 ， 引 进 全 美 通行 的 教学 辅导 书 “Schaum's Outlines” 系 列 组 成 
“全 美 经 典 学 习 指 导 系 列 "。 为 了 保证 这 三 套 丛 书 的 权威 性 ， 同 时 也 为 了 更 好 地 为 学 校 和 老师 
们 服务 ， 华 章 公司 聘请 了 中 国 科学 院 、 北 京 大 学 、 清 华 大 学 、 国 防 科技 大 学 、 复 旦 大 学 、 上 
海 交通 大 学 、 南 京 大 学 、 浙 江 大 学 、 中 国 科技 大 学 、 哈 尔 滨 工业 大 学 、 西 安 交通 大 学 、 中 国 
人 民 大 学 、 北 京 航空 航天 大 学 、 北 京 邮电 大 学 、 中 山大 学 、 解 放 军 理工 大 学 、 郑 州 大 学 、 湖 
北 工学 院 、 中 国 国家 信息 安全 测评 认证 中 心 等 国内 重点 大 学 和 科研 机 构 在 计算 机 的 各 个 领域 
的 著名 学 者 组 成 “专家 指导 委员 会 *， 为 我 们 提供 选 题 意见 和 出 版 监督 。 

这 三 套 从 书 是 响应 教育 部 提出 的 使 用 外 版 教材 的 号 召 ， 为 国内 高 校 的 计算 机 及 相关 专业 





的 教学 度 身 订 造 的 。 其 中 许多 教材 均 已 为 M. 1. T.，Stanford，U.C. Berkeley，C. M. U. 等 世界 
名 牌 大 学 所 采用 。 不 仅 涵盖 了 程序 设计 、 数 据 结 构 、 操 作 系 统 、 计 算 机 体系 结构 、 数 据 库 、 
编译 原理 、 软 件 工 程 、 图 形 学 、 通 信 与 网 络 、 离 散 数学 等 国内 大 学 计算 机 专业 普遍 开设 的 核 
心 课程 ， 而 且 各 具 特 色 一 一 有 的 出 自 语言 设计 者 之 手 、 有 的 历经 三 十 年 而 不 豪 、 有 的 已 被 全 
世界 的 几 百 所 高 校 采用 。 在 这 些 圆 熟 通 博 的 名 师 大 作 的 指引 之 下 ， 读 者 必 将 在 计算 机 科学 的 
宫殿 中 由 登 堂 而 入 室 。 

权威 的 作者 、 经 典 的 教材 、 一 流 的 译 者 、 严 格 的 审 校 、 精 细 的 编辑 ， 这 些 因素 使 我 们 的 
图 书 有 了 质量 的 保证 ， 但 我 们 的 目标 是 尽善尽美 ， 而 反馈 的 意见 正 是 我 们 达到 这 一 终极 目标 
的 重要 帮助 。 教 材 的 出 版 只 是 我 们 的 后 续 服 务 的 起 点 。 华 章 公司 欢迎 老师 和 读者 对 我 们 的 工 
作 提 出 建议 或 给 予 指正 ， 我 们 的 联系 方法 如 下 : 


电子 邮件 : hzjsj@hzbook.com 

联系 电话 : (010) 68995264 

联系 地 址 : 北京 市 西城 区 百 万 庄 南 街 1 号 
邮政 编码 : 100037 





专家 指导 委员 会 


( 按 姓 氏 笔画 顺序 ) 
冯 博 琴 
孙 玉 芳 
李 师 贤 
陆 象 达 
重 小 峰 
钟 玉 琢 
程 好 


史 忠 植 
吴 世 中 
李 建 中 
陈 向 群 
知 丽 华 
唐 世 渭 
程 时 疯 


史 美 林 
吴 时 霖 
杨 冬青 
周 伯 生 
范 明 
豪 党 义 


谢 希 仁 





译 者 序 

计算 机 的 出 现 给 人 类 社会 的 发 展 带 来 了 深刻 变革 ， 计 算 机 革命 就 如 同 自 然 规律 一 般 ， 不 可 避免 地 
将 人 类 带 人 数字 化 时 代 。 今 天 ， 计 算 机 科学 无 处 不 在 ， 与 人 们 的 生活 、 学 习 、 工 作 和 娱乐 都 息息相关 。 

本 书 是 针对 计算 机 科学 和 电子 工程 等 专业 的 学 生 编 写 的 内 容 适 中 、 适 用 性 强 和 可 读 性 好 的 计算 机 
组 成 原理 和 体系 结构 教材 。 主 要 内 容 包 括 : 数字 逻辑 和 数字 系统 、 机 器 层次 的 数据 表示 方法 、 汇 编 层 
次 的 机 器 组 织 和 结构 、 存 储 器 的 组 成 和 结构 、 接 口 和 通信 、 功 能 组 织 、 多 处 理 器 和 可 供 选 择 的 其 他 结 
构 、 性 能 增强 、 网 络 结构 和 分 布 式 计算 机 系统 等 。 

本 书 对 教材 的 内 容 进行 了 精心 的 组 织 ， 由 浅 人 深层 次 分 明 ， 对 计算 机 硬件 没有 预备 知识 的 要 求 ， 
非常 适合 于 大 学 本 科教 学 。 本 书 不 仅 汇集 了 相关 领域 的 基本 原理 ， 而 且 给 出 了 许多 米 自 现实 生活 的 例 
证 ， 帮 助 读 者 很 好 地 理解 计算 机 科学 和 技术 是 如 何 与 实际 问题 相 结合 的 。 从 而 ， 可 以 大 大 激发 读者 的 
学 习 兴 趣 。 不 容 置 疑 ， 阅读 本 书 过 程 中 ， 读 者 将 发 现 很 多 乐趣 。 

本 书 突破 了 计算 机 组 成 原理 和 体系 结构 的 常规 教学 模式 ,将 原本 复杂 抽象 的 计算 机 问题 组 合成 一 
些 特定 的 案例 ,集合 起 来 讲述 这 些 内 容 ， 而 不 是 简单 地 把 单个 问题 堆积 在 一 起 。 本 书 将 计算 机 硬件 和 
软件 的 知识 组 合 起 来 ， 给 读者 一 幅 完 整 的 图 像 。 读 者 通过 一 些 特定 环境 下 的 学 习 ， 可 以 很 方便 地 将 这 
些 基 本 概念 移植 到 实际 工作 中 。 通 过 这 种 将 问题 的 解释 、 举 例 说 明 、 习 题 练习 、 专 题 讨 论 和 模拟 研究 
组 合 在 一 起 的 教学 方法 ， 在 一 个 合适 的 层面 上 给 学 生 一 个 整体 学 习 的 感受 ， 使 读者 可 以 很 轻松 地 了 解 
现代 计算 机 的 内 在 工作 方式 。 

与 一 般 的 计算 机 组 成 原理 和 体系 结构 的 教材 不 同 ， 本 书 专门 为 教学 精心 设计 了 一 个 教学 模型 
MARIE (一 个 真正 直观 而 简单 的 机 器 体系 结构 ) 作为 教学 的 切入 点 。 通 过 MARIE 模型 ， 读 者 很 容易 
掌握 计算 机 组 成 原理 和 体系 结构 的 各 种 基本 概念 ， 而 不 至 于 纠缠 于 真实 体系 结构 所 存在 的 那些 不 必要 
的 和 复杂 的 细节 之 中 。 

本 书 还 提供 了 丰富 的 补充 材料 和 练习 题 ， 可 以 极 大 地 增强 教材 本 身 的 使 用 和 学 习 效 率 。 各 种 练习 
题 可 以 强化 对 主要 概念 的 理解 ， 为 读者 提供 即时 的 学 习 反 馈 ， 通 过 重复 过 程 来 加 强 理解 。 

在 本 书 的 翻译 过 程 中 ， 我 们 力求 忠实 原作 。 何 旭 曙 和 裴 颁 伟 在 本 书 初 稿 翻 译 中 协助 完成 了 部 分 工 
作 ， 在 此 表示 囊 心 感谢 。 限 于 译 者 水 平 ， 本 书 的 翻译 难免 会 存在 线 漏 ， 奶 请 广大 读者 批评 指正 。 


黄 河 
华南 师范 大 学 计算 机 学 院 
2005 年 12 月 10 日 
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给 学 生 的 话 


本 书 是 一 本 关于 计算 机 组 成 与 体系 结构 的 教材 ， 侧 重 于 介绍 信息 数字 处 理 的 各 种 部 件 的 功能 和 设 
计 。 本 书 按照 不 同 的 分 层 结 构 来 展示 计算 机 系统 ， 从 低层 的 硬件 到 高 层 的 软件 ， 包 括 汇编 语言 和 操作 
系统 。 这 些 层次 组 成 了 一 个 虚拟 机 的 分 层 结构 。 计 算 机 组 成 原理 主要 讨论 计算 机 的 分 层 结构 和 如 何 划 
分 这 些 分 层 ， 以 及 每 个 层次 的 实现 。 计 算 机 体系 结构 主要 讨论 的 是 硬件 和 软件 之 间 的 接口 ， 研 究 的 重 
点 是 计算 机 系统 的 构造 和 行为 特征 。 本 书 正文 中 的 大 部 分 内 容 涉及 的 都 是 计算 机 硬件 、 计 算 机 组 成 原 
理 和 体系 结构 ， 以 及 它们 与 软件 性 能 之 间 的 相互 关系 。 | 

学 生 们 经 常会 问 :“ 假 如 我 主 修 计算 机 科学 专业 ， 为 什么 必须 学 习 计算 机 硬件 ? 硬件 不 是 计算 机 工 
程 师 的 任务 吗 ? 为 什么 我 们 要 关心 计算 机 内 部 是 什么 样子 呢 ?” 作 为 计算 机 用 户 ， 我 们 也 许 不 会 太 在 意 
计算 机 的 内 部 结构 ， 就 像 我 们 驾驶 汽车 时 不 会 太 在 意 汽车 引擎 盖 里 面 的 构造 一 样 。 当 然 ， 人 们 可 以 编 
写 高 级 语言 程序 ， 而 无 需 了 解 这 些 程序 的 执行 过 程 。 也 可 以 方便 地 使 用 各 种 应 用 程序 包 ， 而 无 需 理解 
它们 的 工作 原理 。 但 是 ， 如 果 当 我 们 编写 的 程序 需要 运行 得 更 快 和 更 高 效 时 ， 或 者 当 我 们 使 用 的 应 用 
程序 并 不 是 真正 想 要 的 程序 时 ， 又 会 发 生 什 么 情况 呢 ? 作为 计算 机 科学 家 ， 我 们 需要 对 计算 机 系统 本 
身 有 一 个 基本 的 了 解 ， 才 能 解决 上 面 的 这 些 问 题 。 

在 计算 机 系统 中 ， 计 算 机 硬件 和 计算 机 编程 以 及 软件 部 分 的 各 个 方面 都 存在 一 种 基本 关系 。 要 编 
写 好 的 软件 ， 对 计算 机 有 一 个 整体 的 认识 是 十 分 重要 的 。 对 计算 机 硬件 的 理解 ， 有 助 于 解释 某 些 时 候 
程序 中 出 现 的 一 些 神秘 错误 ， 例 如 大 家 熟悉 的 分 段 出 错 或 总 线 错 误 。 对 于 高 级 程序 设计 人 员 来 说 ， 需 
要 掌握 的 有 关 计 算 机 组 成 原理 和 体系 结构 的 知识 的 程度 ， 取 决 于 他 们 需要 完成 的 任务 。 

例如 ， 如 果 要 编写 一 个 编译 程序 ， 必 须 了 解 要 编译 的 特定 硬件 。 硬 件 中 使 用 的 某 些 思想 〈 比 如 说 
流水 线 作 业 ) 可 以 采纳 到 编译 技术 中 来 ， 这 样 可 以 使 编译 器 更 快 更 高 效 地 运行 。 要 对 大 规模 的 复杂 的 
实时 系统 建 模 ， 必 须 了 解 浮 点 算术 应 该 和 能 够 完成 的 任务 ， 及 其 工作 原理 〈 这 些 内 容 不 是 同一 件 事 
情 )。 要 编写 有 关 视 频 、 磁 盘 或 其 他 输入 /输出 接口 ， 必 须 很 好 地 理解 /O 接口 和 计算 机 体系 结构 的 基 
本 知识 。 对 于 艇 入 式 系统 来 说 ， 由 于 它们 通常 在 资源 上 受到 很 大 限制 ， 所 以 我 们 必须 理解 时 间 、 空 间 
和 价格 三 者 之 间 的 平衡 。 若 要 从 事 硬件 系统 、 网 络 或 特殊 算法 等 问题 的 研究 调查 和 推荐 工作 ， 必 须 非 
常熟 悉 计算 机 的 性 能 基准 ， 并 且 能 够 恰当 地 展示 系统 的 性 能 结果 。 在 购买 计算 机 之 前 ， 应 该 了 解 计算 
机 的 性 能 指标 ， 以 及 某 些 商家 为 证 明 自 己 的 系统 优 于 其 他 系统 而 操控 性 能 测试 结果 的 方式 。 不 管 我 们 
在 哪个 专业 领域 工作 ， 作 为 一 位 计算 机 科学 家 ， 熟 悉 了 解 硬件 与 软件 之 间 的 相互 作用 是 必 不 可 少 的 。 

读者 也 许 会 奇怪 ， 为 什么 本 书 的 标题 上 有 一 个 很 大 的 单词 “essentiais”( 基 本 的 )。 这 里 有 两 个 理 
由 。 首 先 ， 计算 机 组 成 原理 的 内 容 广泛 ， 并 且 每 天 都 在 发 展 。 第 二 ， 很 难 定义 在 信息 的 浩渺 大 海中 ， 
孵 些 话题 真正 是 基本 的 以 及 哪些 知识 只 是 需要 了 解 的 。 编 写本 书 时 ， 我 们 的 目的 是 希望 为 大 家 提供 一 
本 符合 美国 计算 机 学 会 (ACM) 和 电气 和 电子 工程 师 协 会 (IEEE) 出 版 的 计算 机 体系 结构 课程 指导 网 
要 的 简明 教材 。 计 算 机 专家 一 致 认为 ， 这 个 课程 指导 纲要 中 的 主题 内 容 构成 了 有 关 计 算 机 组 成 原理 和 
体系 结构 知识 的 “基本 ”核心 体 。 

我 们 对 于 我 们 认为 有 用 的 某 些 主题 内 容 ， 但 对 于 学 生 继 续 从 事 计 算 机 科学 研究 和 未 来 专业 领域 的 
进一步 发 展 并 不 是 基本 的 一 些 ACM/IEEE 推荐 的 课程 也 进行 了 强调 。 这 里 ， 我 们 觉得 对 大 家 继续 从 事 
计算 机 科学 的 研究 工作 有 帮助 的 内 容 应 该 包括 操作 系统 、 编 译 器 、 数 据 库 管 理 和 数据 通信 等 。 本 书 还 
包括 其 他 一 些 内 容 ， 这 些 内 容 将 会 有 助 于 读者 理解 现实 生活 中 实际 计算 机 系统 的 工作 原理 和 过 程 。 
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我 们 希望 阅读 本 书 会 是 一 种 愉快 的 经 历 ， 并 且 和 希望 读者 花 些 时 间 对 我 们 介绍 的 某 些 资料 进行 更 深 
人 的 钻研 。 我 们 的 目的 是 希望 在 正式 课程 的 学 习 完 成 后 的 较 长 的 一 段 时 间 内 ， 本 书 都 可 以 作为 一 本 有 
用 的 参考 资料 。 虽 然 我 们 希望 尽力 为 读者 提供 大 量 充实 的 信息 资料 ， 但 这 些 内 容 在 读者 以 后 的 学 习 和 
事业 过 程 中 仅仅 是 构建 一 个 基础 。 成 功 的 计算 机 专业 人 士 ， 将 会 对 理解 计算 机 的 工作 原理 不 断 增添 新 
的 知识 。 欢 迎 开始 计算 机 王国 的 旅行 。 


写 给 教师 的 话 
关于 本 书 


本 书 起 源 于 宾夕法尼亚 大 学 Harrisburg 分 校 的 两 个 计算 机 科学 组 成 原理 和 体系 结构 班 的 授课 内 
容 。 随 着 计算 机 科学 课程 的 不 断 发 展 ， 我 们 发 现 不 仅 课程 中 所 讲授 的 材料 需要 进行 修改 ， 而 且 课程 的 
内 容 也 需要 从 两 个 学 期 的 教学 浓缩 成 一 学 期 3 个 学 分 的 课程 。 许 多 其 他 学 院 也 意识 到 需要 对 原来 的 内 
容 进行 压缩 ， 以 便 给 一 些 新 兴 的 主题 内 容留 出 更 多 的 空间 。 这 门 新 课程 ， 与 本 教材 一 样 ， 最 初 是 为 主 
修 计 算 机 科学 的 学 生 准 备 的 。 其 目的 是 讲授 一 些 计算 机 科学 专业 的 学 生 必 须 熟 悉 的 有 关 计 算 机 组 成 原 
理 和 体系 结构 方面 的 内 容 。 本 书 不 仅 汇 集 了 这 些 领域 的 基本 原理 ， 而 且 只 要 是 对 学 生 扩 展 专业 知识 和 
从 事 计 算 机 科学 的 深入 研究 有 益 的 主题 内 容 都 会 加 以 介绍 ， 激 发 学 生 的 学 习 兴 趣 。 

我 们 编著 本 书 的 主要 目的 是 希望 改变 计算 机 组 成 原理 和 体系 结构 的 常规 教学 模式 。 计 算 机 科学 专 
业 的 学 生 在 完成 计算 机 组 成 原理 和 体系 结构 的 课程 学 习 之 后 ， 不 但 要 掌握 有 关 数 字 计 算 机 的 主要 基本 
概念 ， 而 且 要 理解 这 些 基本 概念 是 如 何 应 用 于 现实 世界 中 。 这 些 概念 的 内 容 应 该 远 远 超过 计算 机 销售 
商 所 用 的 专用 术语 和 和 构思。 事实 上 ， 学 生 们 应 该 能 够 掌握 特定 的 环境 下 给 出 的 这 些 概念 ， 并 且 可 以 将 
这 些 概念 移植 到 实际 工作 中 ， 反 之 亦 然 。 另外， 学 生 也 必须 为 该 领域 的 进一步 学 习 打 下 坚实 的 基础 。 

我 们 希望 借助 本 教材 传授 一 些 每 位 计算 机 科学 专业 的 学 生 都 应 该 了 解 、 熟 悉 或 掌握 的 知识 。 我 们 . 
并 没有 要 求 使 用 本 教材 的 学 生 要 完全 掌握 本 书 介绍 的 全 部 内 容 。 但 是 ， 我 们 非常 希望 本 书 中 有 些 内 容 是 学 生 
必须 掌握 的 ， 有 些 内 容 是 学 生 必 须 清楚 熟悉 的 ， 而 对 于 仅 做 了 简要 介绍 的 内 容 学 生 只 需要 了 解 就 足够 了 。 

有 些 概念 具有 一 定 的 深度 ， 仅 靠 单独 学 习 基本 原理 是 很 难 理解 的 。 因 此 ， 我 们 将 问题 的 解决 方案 
集合 起 来 讲述 这 些 内 容 ， 而 不 是 简单 地 把 单个 问题 堆积 在 一 起 。 本 书 将 问题 的 解释 、 举 例 说 明 、 习 题 
练习 、 专 题 学 习 和 模拟 研究 组 合 在 一 起 ， 在 一 个 合适 的 层面 上 给 学 生 一 个 整体 的 学 习 感 受 ， 了 和 解 现代 
数字 计算 机 的 内 在 工作 方式 。 

我 们 采用 一 种 非 正规 的 形式 编写 本 教材 ， 省 略 了 一 些 不 必要 的 技术 术语 。 在 写作 上 ， 尽 量 简 明 扼 
要 ， 和 避免 一 些 不 必要 的 抽象 概念 ， 希 望 增 加 学 生 们 的 兴 超 。 我 们 还 扩充 了 内 容 范 围 ， 增 加 了 一 般 计 算 
机 体系 结构 的 初级 教材 中 没有 的 系统 软件 、 操 作 系 统 简介 、 性 能 测评 、 可 选 的 其 他 计算 机 体系 结构 ， 
以 及 网 络 导 论 等 一 些 与 计算 机 硬件 密切 相关 的 主题 内 容 。 像 大 多 数 的 著作 一 样 ， 我 们 也 挑选 了 一 种 结 
构 模 型 作为 主线 ,但 是 这 个 模型 是 为 了 简化 问题 而 精心 设计 的 。 


本 教材 与 计算 机 课程 2001 的 关系 


2001 年 12 月 ，ACM 和 IEEE 联合 工作 小 组 公布 了 2001 年 计算 机 课程 指南 “CC-2001) 。 这 个 指南 
是 对 非常 流行 的 计算 机 课程 1991 的 第 一 次 主要 修改 。CC-2001 与 CC-1991 相 比 ， 存 在 几 个 重要 的 改 
变 ， 我 们 这 里 只 关注 有 关 计 算 机 组 成 原理 和 体系 结构 方面 的 改变 。CC-1991 推荐 计算 机 体系 结构 的 教 
学 学 时 约 为 59 小 时 (课程 定 为 组 成 原理 和 体系 结构 ， 课 程 代号 是 AR)。 主 要 包括 以 下 内 容 : 数字 多 
辑 、 数 字 系 统 、 机 器 层次 的 数据 表示 方法 、 汇 编 层次 的 计算 机 组 织 结构 、 存 储 器 系统 的 组 成 和 结构 、 
接口 和 通信 ， 以 及 可 供 选 择 的 其 他 计算 机 体系 结构 。 最 新 公布 的 CC-2001 (可 在 网 直 
www. computer. org/education/cc2001 查阅 ) 将 计算 机 结构 的 课程 内 容 缩减 为 36 个 核心 学 时 。 其 中 包 
括 数字 逻辑 和 数字 系统 (3 学 时 )， 机 器 层次 的 数据 表示 方法 (3 学 时 )， 汇 编 层 次 的 计算 机 组 成 原理 和 
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体系 结构 (9 学 时 ) ， 存 储 器 组 织 和 结构 (5 学 时 )， 接 口 和 通信 (3 学 时 )， 功 能 组 织 (7 学 时 ) ， 以 及 
多 处 理 器 和 可 供 选择 的 其 他 体系 结构 (3 学 时 ) 。 另 外 ，CC-2001 还 建议 将 性 能 增强 和 有 关 网 络 的 结构 ， 
以 及 分 布 式 计算 机 系统 作为 CC-2001 中 计算 机 组 成 原理 和 体系 结构 教学 模块 的 一 部 分 。 在 我 们 对 课程 
进行 全 面 修改 并 编写 本 教材 后 ， 让 人 高 兴 的 是 这 本 新 编 有 关 计 算 机 组 成 原理 和 体系 结构 的 教材 与 
ACM/IEEE 2001 课程 指南 直接 相关 的 内 容 有 如 下 的 几 个 部 分 ， 

AR1, 数字 逻辑 和 数字 系统 〈 核 心 课程 ): 第 1、3 章 

AR2. 机 器 层次 的 数据 表示 方法 (核心 课程 ); 第 2 章 

AR3. 汇编 层次 的 机 器 组 织 和 结构 (核心 课程 ); 第 4、5、6 章 

AR4. 存储 器 的 组 成 和 结构 (核心 课程 ): 第 6 章 

AR5. 接口 和 通信 (核心 课程 ): 第 ?7 章 

AR6, 功能 组 织 〈 核 心 课 程 ), 第 4、5 章 

AR7. 多 处 理 器 和 可 供 选 和 铎 的 其 他 结构 (核心 课程 ): 第 9 章 

AR8. 性 能 增强 〈 选 修 ): 第 9、10 章 

AR9. 网 络 结构 和 分 布 式 计算 机 系统 (选修 ): 第 11 章 


为 什么 编写 本 教材 


姐 容 置疑 ， 当 今 的 市 场 上 已 经 充斥 了 大 量 有 关 计 算 机 组 成 原理 和 体系 结构 的 教材 。 在 我 们 25 年 多 
该 课程 的 教学 经 历 中 ， 已 经 使 用 过 许多 好 教材 。 但是， 每 次 讲授 课程 时 ， 课 程 的 内 容 都 发 生 了 进化 演 
变 。 最 后 ， 我 们 总 是 发 现 需要 编写 更 多 的 课程 笔记 来 弥补 教材 中 的 材料 和 现在 课程 中 需要 讲授 的 材料 
之 间 的 缺口 间隙 。 我 们 常常 发 现 我 们 对 于 计算 机 组 成 原理 和 体系 结构 的 课程 正在 从 计算 机 工程 的 方法 
转向 对 于 这 些 主题 的 计算 机 科学 的 方法 。 在 决定 将 计算 机 组 成 原理 和 体系 结构 的 课程 整合 为 一 门 课程 
时 ,我 们 却 不 能 找到 一 本 可 以 覆盖 整个 主题 所 需要 的 材料 ， 一 本 真正 从 计算 机 科学 角度 编写 ， 没 有 专 
用 计算 机 术语 ， 并 且 可 以 在 介绍 这 些 主题 之 前 激发 学 生 兴 趣 而 设计 的 教材 。 

本 教材 希望 传授 现代 计算 机 系统 发 展 过 程 中 所 采用 的 设计 思想 ， 以 及 这 种 设计 思想 对 计算 机 科学 
专业 的 学 生 会 产生 什么 影响 。 但是， 学 生 在 学 习 和 鉴赏 计算 机 设计 中 那些 不 可 触摸 的 方方面面 的 内 容 
之 前 ， 必 须 首先 牢固 掌握 一 些 基本 概念 。 大 多 数 关于 计算 机 组 成 原理 和 体系 结构 的 教材 针对 这 些 基 本 
概念 方面 的 内 容 的 有 关 技术 信息 都 进行 了 类 似 的 介绍 。 但 是 ， 我 们 的 教材 特别 注重 这 些 信 息 应 该 覆盖 
的 程度 ， 即 特别 注重 书 中 的 内 容 与 计算 机 科学 专业 学 生 的 相关 程度 。 例 如 ， 在 本 书 的 全 部 内 容 中 ， 如 
果 需 要 有 具体 的 论证 ,我们 提供 如 个 人 计算 机 ， 企 业 级 的 计算 机 系统 ， 以 及 大 型 主机 等 ， 这 类 在 实践 中 
最 可 能 过 到 的 系统 类 型 。 我 们 避免 其 他 类 似 书籍 中 流行 的 “PC 偏 置 (PC bias)” 这 类 情况 ， 希 望 同 学 
们 可 以 了 解 这 些 结构 的 差异 和 相似 性 ， 以 及 在 当今 自动 化 结构 体系 中 扮演 的 角色 。 对 许多 人 来 说 ， 常 

忘记 了 教材 的 目的 ， 也 是 唯一 最 重要 的 关键 是 学 习 。 为 了 这 个 目的 ,我 们 加 入 了 许多 实际 例证 ， 并 
且 努 力 把 理论 与 实践 相 结合 并 做 到 平衡 。 


本 书 的 主要 特色 


本 教材 采用 了 许多 方法 来 强化 计算 机 组 成 原理 和 体系 结构 的 各 种 概念 ， 以 便 更 方便 学 生 的 学 习 。 
其 中 包括 如 下 一 些 特色 内 容 : 

"插入 段 : 这 些 插 人 段 包 含 一 些 相关 的 信息 ， 这 是 一 些 课本 章节 的 主题 之 外 的 内 容 。 读 者 可 以 通过 

这 些 插入 段 对 课程 内 容 进 行 深入 学 习 和 研究 。 

“ 实际 例证 ， 本 书 给 出 了 许多 来 自 现实 生活 的 例证 ， 可 以 帮助 学 生 更 好 地 理解 计算 机 科学 和 技术 是 

如 何 与 实际 问题 相 结 合 的 。 

“ 本章 小 结 : 对 每 章 的 内 容 做 一 个 简明 扼要 的 重点 总 结 。 

“深入 阅读 ， 这 部 分 内 容 为 那些 想 要 详细 研究 该 章 主要 课题 的 读者 列 出 了 一 些 额外 的 资源 。 其 中 的 





参考 文献 包括 一 些 与 主题 有 关 的 权威 性 文章 和 书籍 。 

。 复 习题 : 每 章 都 设计 了 一 组 复习 问答 题 ， 以 帮助 读者 牢固 掌握 该 章 的 主要 内 容 。 

。 练 习题; 每 章 都 挑选 了 大 量 的 练习 题 ， 以 加 强 对 所 学 概念 的 理解 和 记忆 。 一 些 较 难 的 练习 题 采用 
星 号 标记 。 

。 部 分 练习 题 答案 和 提示 : 为 了 使 学 生 顺 利 完 成 练习 题 ， 本 书 还 对 每 章 一 些 有 代表 性 的 问题 给 出 答 
案 。 本 教材 后 面部 分 给 出 答案 的 问题 采用 菱形 符号 来 标记 。 

.专题 内 容 : 这 部 分 为 希望 详细 讲述 某 些 专题 的 教师 提供 额外 的 资料 ， 例 如 卡 诺 图 和 输入/ 输出 等 。 
这 部 分 内 容 也 附 有 练习 题 。 

。 附录: 书 中 的 附录 简要 介绍 或 复习 数据 结构 ， 包 括 堆栈 、 链 接 列 表 和 树 结 构 等 。 

。 术 语 表 : 内 容 广 泛 ， 包括 各 章节 所 有 关键 术语 的 简要 定义 。 


关于 本 书 的 作者 


本 书 的 作者 不 但 有 超过 25 年 的 相关 领域 的 教学 经 验 ， 而 且 拥 有 20 年 行业 实践 的 经 历 。 由 于 这 些 
背景 ， 本 书 更 加 强调 的 是 计算 机 组 成 原理 和 体系 结构 的 基本 原理 ， 及 其 与 现实 世界 的 相互 关系 。 通 过 
一 些 现实 生活 的 例证 帮助 学 生 更 好 地 理解 这 些 基本 概念 是 如 何 应 用 于 计算 机 世界 的 。 

Linda Null，j 1991 年 在 美国 爱 荷 华 州 立 大 学 获得 计算 机 科学 博士 学 位 ，1989 年 获得 爱 荷 华 州立 
大 学 计算 机 科学 硕士 学 位 ，1983 年 获得 西南 密苏里 州立 大 学 计算 机 科学 教育 硕士 学 位 ，1980 年 获得 西 
南 密苏里 州立 大 学 数学 教育 硕士 学 位 ，1977 年 获得 西南 密苏里 州立 大 学 数学 和 英语 教育 学 士 学 位 。 她 
教授 数学 和 计算 机 科学 课程 已 经 超过 25 年， 目前 担任 宾夕法尼亚 州立 大 学 Harrisburg 校区 计算 机 科学 
研究 生 课程 的 协调 管理 员 。 她 1995 年 成 为 宾夕法尼亚 州立 大 学 Harrisburg 校区 的 一 名 教师 。 她 的 主要 
研究 领域 包括 计算 机 组 成 原理 和 体系 结构 、 操 作 系 统 和 计算 机 安全 等 。 

Julia Lobur， 在 计算 机 行业 从 业 20 余年 。 她 是 一 位 计算 机 系统 的 专家 顾问 ， 专 业 程 序 设计 员 / 分 
析 师 ， 计 算 机 系统 和 网 络 设计 师 ， 此 外 还 担任 软件 开发 经 理 。 另 外 ， 她 还 兼职 一 些 教学 任务 。 


课程 需要 的 预备 知识 


通常 ， 本 课程 要 求学 生 具 有 一 年 以 上 使 用 高 级 程序 语言 编程 的 经 验 。 还 需要 学 习 一 年 以 上 的 大 学 
数学 课程 〈 微 积分 或 离散 数学 ) ， 本 教材 使 用 了 这 些 相关 的 数学 概念 。 本 书 不 要 求 具备 计算 机 硬件 知识 。 

计算 机 组 成 原理 和 体系 结构 通常 作为 进一步 学 习 有 关 计算 机 高 级 课程 的 必修 课程 ， 例 如 操作 系统 
(学 生 需 要 掌握 有 关 存储 器 分 层 结构 、 并 发 、 异 常 和 中 断 等 概念 )， 编 译 器 (学生 要 求 了 解 有 关 指令 系 
统 、 存 储 器 寻 址 和 链接 等 概念 ) ， 网 络 〈 在 学 习 将 各 元 件 组 合成 计算 机 网 络 之 前 必须 了 解 计算 机 系统 的 
各 部 分 的 硬件 )， 当 然 ， 也 是 一 些 高 级 计算 机 体系 结构 课程 的 预备 课程 。 


本 书 的 组 织 结构 和 主要 内 容 


本 书 希望 全 面 简要 地 介绍 计算 机 科学 专业 学 生 所 必须 掌握 的 基本 概念 。 我 们 不 认为 要 做 到 这 一 点 ， 
最 好 的 方法 是 将 内 容 划分 为 不 同 的 主题 模块 。 央 此 ， 本 书 采用 了 一 种 结构 化 的 ， 但 也 是 完整 综合 性 的 
方式 ， 围 绕 有 关 完 整 的 计算 机 系统 的 各 个 层面 来 组 织 内 容 。 

与 许多 流行 的 教材 一 样 ， 我 们 采用 自 下 而 上 (bottom-up) 的 方法 来 安排 课程 内 容 。 首 先 从 数字 胸 
辑 层次 开始 ， 构 建 一 个 学 生 在 学 习 本 课程 前 就 应 该 熟悉 的 计算 机 应 用 层面 。 教 材 的 内 容 经 过 了 精心 的 
组 织 ， 以 便 使 读者 在 进入 下 一 个 层次 之 前 ， 能 够 完全 理解 本 层次 的 内 容 。 当 读者 到 达 应 用 层面 时 ， 有 
关 计算 机 组 成 原理 和 体系 结构 的 基本 概念 都 已 经 讲述 。 我 们 的 目的 是 让 学 生 可 以 将 计算 机 硬件 知识 与 
他 们 所 掌握 的 有 关 编 程 的 基本 概念 联系 起 来 ， 获 得 有 关 计 算 机 硬件 和 软件 组 合 的 一 个 完整 视图 。 从 根 
本 上 来 说 ， 对 计算 机 硬件 的 了 解 程度 会 对 计算 机 软件 的 设计 和 性 能 有 重大 影响 。 如 果 学 生 们 能 够 打下 
一 个 计算 机 硬件 知识 的 坚实 基础 ， 无 疑 会 对 他 们 将 来 成 为 一 位 出 色 的 计算 机 科学 家 大 有 帮助 。 





好 


有 关 计 算 机 组 成 原理 和 体系 结构 的 各 种 概念 都 涉及 到 计算 机 专业 人 员 每 天 从 事 的 日 常 工作 的 方 方 
面 面 。 几 于 计算 机 专业 人 员 必 须 接 受 的 教育 领域 众多 ， 所 以 我 们 采取 从 高 层次 视野 的 角度 来 讲述 计算 
机 的 体系 结构 ， 只 有 在 理解 某 个 特定 的 概念 时 才 涉 及 低层 次 的 具体 内 容 。 例 如 ， 在 讨论 指令 系统 (ISA) 
时 ， 会 在 各 种 不 同 的 实例 研究 的 内 容 中 引入 与 硬件 有 关 的 问题 ， 以 便 区 分 和 强化 与 ISA 设计 有 关 各 种 问题 。 

本 书 的 正文 分 为 11 个 章节 和 一 个 附录 : 

“第 1 章 : 简要 回顾 了 有 关 计 算 机 的 历史 展 ， 阐 述 了 计算 系统 发 展 过 程 中 的 许多 重大 事件 ， 读 者 可 
以 比较 直观 地 了 解 计算 机 发 展 是 如 何 达 到 今天 的 成 就 的 。 本 章 介 绍 了 一 些 计 算 机 专业 基本 术语 ， 
计算 机 系统 的 各 个 组 成 部 件 ， 计 算 机 系统 的 不 同 逻 辑 层 次 ， 以 及 汉 “。 诺 伊 曼 计算 机 模型 。 本 章 给 
读者 一 个 有 关 计 算 机 的 高 层次 的 视野 ， 以 及 进一步 深入 学 习 计算 机 知识 的 动机 和 必要 的 基本 概念 。 
第 2 章 : 全 面 介 绍 了 数字 和 字符 信息 的 各 种 表示 方法 。 读 者 可 以 学 习 到 有 关 基 数 和 儿 种 常用 的 数 
字 表 示 技 术 ， 例 如 反 码 (1 补 )、 补 码 (2 补 ) 和 BCD 编码 ， 还 讨论 了 加 、 减 、 乘 、 除 等 运算 法 
则 。 此 外 ， 还 介绍 了 EBCDIC、ASCII 和 统一 字符 编码 。 定 点 表示 法 和 浮 点 表示 法 也 在 本 章 作 了 
介绍 。 最后， 简单 讨论 了 数据 记录 的 编码 方式 ， 错 误 检 测 和 错误 校正 问题 。 

第 3 章 : 传统 数字 逻辑 内 容 介 绍 。 本 章 详细 讨论 了 组 合 逻辑 和 时 序 逻 辑 电 路 。 通 过 本 章 的 学 习 读 
者 可 以 理解 比较 复杂 的 中 规模 集成 电路 (MSH ， 例 如 译 码 器 。 本 章 还 介绍 了 一 些 更 加 复杂 的 电 
路 ， 如 总 线 和 存储 器 。 在 本 章 最 后 的 专题 内 容 中 ， 介 绍 了 数字 逻辑 电路 的 优化 和 卡 诺 图 。 
第 4 章 : 详细 说 明了 基本 的 计算 机 组 成 原理 ， 并 且 引 入 了 许多 基本 概念 ， 包 括 取 指 - 译 码 -执行 周 
期 、 数 据 通路 、 时 钟 和 总 线 、 寄 存 器 传输 表示 法 ， 当 然 还 有 CPU。 本 章 展示 了 一 个 简单 的 体系 
结构 ，MARIE 机 器 ， 以 及 相应 的 指令 集 系 统 (ISA)。 通 过 这 个 模型 机 ， 读 者 可 以 对 涉及 程序 执 
行 的 基本 计算 机 体系 结构 有 一 个 全 面 的 了 解 。MARIE 是 一 个 经 典 的 汉 “. 诺 伊 曼 体 系 结构 的 设 
计 ， 其 中 包括 一 个 程序 计数 器 、 一 个 累加 器 、 一 个 指令 寄存 器 、4096 字 节 的 存储 器 ， 以 及 两 种 
寻 址 方式 。 这 里 引入 了 汇编 语言 编程 原理 ， 以 加 深 读者 对 前 面 介绍 的 有 关 指 令 格式 、 指 令 模 式 、 
数据 格式 和 控制 等 概念 的 理解 。 由 于 本 书 不 是 一 本 汇编 语言 的 教材 ， 所 以 并 没有 打算 提供 汇编 
诺言 编程 的 实用 课程 。 本 书 介绍 汇编 语言 的 最 初 目的 是 为 了 理解 并 加 深 一 般 的 计算 机 体系 结构 。 
但 是 ， 由 于 本 章 介 绍 了 一 个 MARIE 的 仿真 器 ， 可 以 编写 汇编 语言 程序 ， 并 利用 仿真 器 汇编 ， 而 
且 可 以 在 MARIE 模型 机 上 和 运行。 本 章 介 绍 了 两 种 控制 方法 : 硬 连 线 和 微 编 程 ， 并 对 这 两 种 方法 
进行 了 比较 研究 。 最 后 ， 对 Intel 和 MIPS 体系 结构 的 计算 机 系统 进行 了 比较 研究 ， 以 强化 本 章 
学 习 的 基本 概念 。 
“第 5 章 : 详细 讨论 了 计算 机 指令 系统 。 包 括 指令 格式 、 指 令 类 型 和 寻 址 方式 。 介 绍 了 指令 级 的 流 
水 线 。 最 后 ， 通 过 学 习 真 实 的 指令 系统 (ISA)， 包 括 Intel、MIPS 和 Java 指令 系统 ,来 加 强 对 
本 章 的 基本 概念 的 理解 。 
第 6 章 : 介绍 了 基本 的 存储 器 概念 ， 比 如 RAM 和 不 同 的 存储 器 件 。 接 下 来 ， 还 介绍 了 一 些 先进 的 存 
储 器 分 层 结构 概念 ， 包 括 高 速 缓 存 存储 器 和 虚拟 存储 器 。 本 章 还 详细 讨论 了 高 速 缓 在 的 几 种 映射 技 
术 : 直接 映射、 关联 映射 和 组 关联 映射 技术 。 另 外 ， 本 章 还 详细 介绍 了 覆盖 、 分 页 和 分 段 技术 、 
TLB， 以 及 与 高 速 缓存 有 关 的 算法 和 设备 。 在 本 书 的 网 站 中 ， 还 可 以 找到 一 个 本 章 的 指南 和 仿真 器 。 
。 第 7 章 : 详尽 描述 了 基本 输入 输出 〈I/O) 、 总 线 通 信和 协议 等 问题 ， 以 及 常用 的 外 存储 器 设备 ， 
如 磁盘 和 光盘 ， 以 及 它们 的 数据 存储 格式 。 还 讨论 了 7 DMA， 可 编程 的 IO 接口 ， 以 及 中 斯 等 。 此 
外 ， 还 介绍 了 不 同 设备 之 间 交 换 信息 的 各 种 技术 。 详 细 讨论 了 RAID 体系 结构 和 各 种 数据 压缩 技术 。 
。 第 8 章 ， 主要 讨论 现行 的 几 种 编程 工具 〈 如 编译 器 和 汇编 器 ) ， 以 及 它们 与 运行 这 些 程序 的 机 器 
的 体系 结构 之 间 的 相互 关系 。 本 章 的 目的 是 加 强 程序 员 的 计算 机 系统 的 观点 与 构成 机 器 的 硬件 
和 体系 结构 之 间 的 联系 。 此 外 ， 还 介绍 了 操作 系统 ， 但 仅 涵 盖 了 系统 的 体系 结构 和 组 成 原理 的 
细节 部 分 ， 例 如 资源 的 使 用 和 保护 、 陷 奎 和 中 断 ， 以 及 各 种 其 他 服务 。 
。 第 9 章 : 对 最 近 几 年 出 现 的 其 他 可 选择 的 体系 结构 做 了 一 般 性 介绍 。 主 要 内 容 包 括 RISC、Flynn 


分 类 法 、 并 行 处 理 机 、 指 令 级 并 行 处 理 、 多 处 理 器 系统 、 互 联网 、 共 享 存储 器 系统 、 高 速 缓存 一 

致 性 问题 、 存 储 器 模型 、 超 标量 计算 机 、 神 经 网 络 、 生 物 计算 机 、 数 据 流 计算 机 ， 以 及 分 布 式 计 

算 机 系统 等 。 本 章 的 主要 目的 是 告诉 读者 ， 计 算 机 并 不 局 限于 冯 “， 诺 伊 曼 体系 结构 。 并 且 促使 读 

者 考虑 有 关系 统 的 性 能 问题 ， 顺 利 过 渡 到 下 一 章 的 学 习 。 

。 第 10 章 : 主要 介绍 计算 机 的 性 能 分 析 和 管理 问题 。 首 先 ， 引 入 了 必要 的 数学 预备 知识 ， 接 着 讨 

论 了 MIPS、FLOPS、 基 准 ， 以 及 计算 机 科学 家 应 该 熟悉 的 各 种 性 能 优化 技术 : 包括 分 支 预测 、 

推测 执行 和 循环 优化 。 

.第 11 章 : 主要 介绍 网 络 的 组 织 和 结构 ， 包 括 网 络 元 件 和 网 络 协议 。 其 中 ，OSI 模型 和 TCP/IP 

协议 组 合 将 在 因特网 的 内 容 中 介绍 。 本 章 不 打算 包罗 万 象 ， 主 要 目的 是 讨论 与 互联 网 结构 相关 

的 计算 机 体系 结构 的 内 容 。 

附录 的 内 容 是 关于 数据 结构 的 。 主 要 考虑 是 学 生 可 能 需要 简要 介绍 或 复习 有 关 堆 栈 、 队 列 和 链接 
列表 〈 链 表 ) 等 主题 内 容 。 

教师 可 以 按照 书 中 编排 的 顺序 教学 ， 但 是 如 果 需 要 也 可 以 改变 各 章节 教学 的 前 后 顺序 。 图 P-1 给 
出 了 不 同 章节 之 间 存 在 的 相互 依赖 关系 。 





图 P-1 本 书 各 章 之 间 的 前 后 依赖 关系 〈 必 要 条 件 ) 
面向 的 读者 
本 书 最 初 是 为 主 修 计算 机 科学 的 大 学 本 科学 生 编写 的 。 虽 然 如 此 ， 但 本 书 也 可 以 作为 主 修 IS 和 II 





专业 的 学 生 的 教材 。 

本 书 所 包含 的 内 容 远 远 超过 了 一 个 学 期 的 教学 内 容 (14 周 ，42 个 学 时 )。 但 是 ， 要 让 普通 学 生 在 
一 个 学 期 的 教学 中 掌握 本 书 的 所 有 内 容 难度 较 大 。 如 果 教 师 想 详细 讲述 本 书 的 全 部 主题 内 容 ， 最 好 采 
用 连续 两 个 学 期 的 时 间 安排 。 教 师 可 以 根据 自己 的 教学 经 验 和 学 生 的 实际 需求 ， 选 择 不 同 的 教学 安排 ， 
对 主要 的 主题 内 容 做 不 同 程度 的 介绍 。 表 P-1 为 教师 提供 了 一 个 各 章节 的 学 时 安排 上 的 建议 ， 以 及 学 
生 们 预期 可 以 达到 的 相应 程度 。 


表 P-1 学 时 安排 建议 









































音 六 一 学 期 (42 学时) 二 学 期 (84 学 时 ) 
学 时 数 预期 水 平 学 时 数 预期 水 平 
1 3 了 掌握 | 3 掌握 
2 6 掌握 6 | 掌握 
3 6 掌握 6 | 掌握 
4 6 熟悉 10 掌握 
5 | 一 3 熟悉 | 8 掌握 
6 5 熟悉 9 掌握 
7 2 熟悉 6 | 掌 所 
8 2 | 了 解 | 7 掌握 
9 -十 3 熟悉 | 9 | 掌握 
10 3 了 解 9 掌握 
11 3 了 解 11 掌握 

















我 们 希望 在 正式 课程 结束 后 ， 本 书 仍 然 可 以 作为 一 本 有 用 的 参考 书 。 
支持 材料 


教材 是 学 习 中 使 用 的 基本 工具 ， 而 丰富 的 补充 材料 和 练习 题 可 以 极 大 地 增强 教材 本 身 的 使 用 和 学 
习 效 率 。 各 种 练习 题 可 以 强化 对 主要 概念 的 理解 ， 为 读者 提供 即时 的 学 习 反 馈 ， 通 过 重复 过 程 来 加 强 
理解 。 为 此 ， 本 书 准备 了 以 下 附加 材料 : 
“教师 手册 (Instructor’s Manual) : 这 本 手册 包含 练习 题 答案 和 模拟 考试 题 。 此 外 ， 本 手册 还 提供 
了 一 些 有 关 概 念 的 教学 建议 和 学 生 通 常 可 能 会 遇 到 的 一 些 难点 问题 。 
* 教 学 幻灯 片 (Lecture Slides): 这 些 幻灯 片 包含 的 资料 可 供 计算 机 组 成 与 体系 结构 一 个 学 期 的 授课 。 
。 图 表 (Figures and Tables): 希望 自己 准备 讲稿 材料 的 教师 可 以 下 载 各 种 图 表 。 
。 存 储 器 指南 和 仿真 器 《Memory Tutorial and Simulator); 利用 这 套 工 具 ， 学 生 们 可 以 运用 他 们 所 
学 的 有 关 Cache 存储 器 和 虚拟 存储 器 的 概念 。 
，MARIE 仿真 器 (MARIE Simulator) : 利用 这 个 仿真 器 可 以 汇编 和 运行 MARIE 程序 。 
。 自 学 软件 《Tutorial Software): 提供 本 书 中 各 种 概念 的 其 他 一 些 自学 软件 。 
。 帮 助 网 址 《The Companion website): 所 有 的 软件 、 幻 灯 片 和 有 关 的 材料 都 可 以 从 本 书 的 网 址 下 载 : 
http: //computerscience. jbpub. com/ECOA 
上 面 提 供 的 练习 题 、 考 试 样题 和 答案 经 过 了 多 个 教学 班级 的 测试 。 使 用 本 书 的 教师 可 以 获得 本 书 提 
供 的 教师 手册 ， 其 中 包括 各 个 章节 的 教学 建议 和 练习 题 答案 ， 还 有 一 些 推荐 的 编程 作业 和 模拟 考试 题 。 


教学 指导 模型 : MARIE 


在 计算 机 组 成 与 体系 结构 的 教学 中 ， 结 构 模 型 的 选择 对 教师 和 学 生 都 有 很 大 的 影响 。 如 果 选 择 的 
模型 过 于 复杂 ， 教 师 和 学 生 都 可 能 会 深 陷于 模型 的 细节 中 ， 而 忽视 了 课堂 所 主要 讲述 的 基本 概念 。 对 
于 实际 的 计算 机 体系 结构 ， 尽 管 会 令 人 感 兴趣 ,但 是 通常 都 具有 许多 独特 的 设计 ， 这 样 使 得 结构 无 法 





站 


在 入 门 级 的 课程 中 使 用 。 令 事情 更 加 困难 的 是 ， 实 际 的 体系 结构 每 天 都 在 发 生变 化 。 另 外 ， 一 般 情况 
下 很 难 找到 一 本 带 有 适合 于 特定 教学 环境 的 计算 机 平台 的 模型 ， 实 际 上 计算 机 的 教学 环境 也 在 年 复 一 
年 地 不 断 发 生变 化 。 

为 了 解决 这 些 问 题 ， 我 们 实现 了 一 个 自己 的 简单 模型 ，MARIE， 专 门 设 计 为 教学 使 用 。 通 过 
MARIE (一 个 真正 直观 而 简单 的 机 器 体系 结构 ) 模型 ， 同 学 们 可 以 方便 地 学 习 计算 机 组 成 与 体系 结构 
的 基本 概念 ， 包 括 汇编 语言 ， 而 不 至 于 陷 人 真实 体系 结构 所 存在 的 不 必要 的 和 复杂 的 细节 之 中 。 尽 管 
模型 很 简单 ， 但 它 模拟 了 一 个 计算 机 功能 系统 。MARIE 机 器 仿真 器 ，MarieSim， 具 有 很 好 的 用 户 友 
好 的 GUI 界面， 利用 这 个 仿真 器 学 生 们 可 以 : (1) 生成 和 编辑 源 代码 ; (2) 汇编 源 代码 变 成 为 机 器 目 
慰 代 码 ; 〈3) 运行 机 器 代码 ; 〈4) 调试 程序 。 

特别 地 ，MARIE 具有 如 下 特点 ， 

。 支 持 第 4 章 引 和 人 的 MARIE 汇编 语言 

。 具 有 一 个 综合 文本 编辑 器 ， 可 以 用 于 程序 生成 和 修改 

“十 六 进 制 的 机 器 语言 目标 代码 

。 有 具有 一 个 综合 调试 器 ， 可 以 实现 单 步 执行 、 断 点 、 暂 停 、 重 启 ， 以 及 寄存 器 和 存储 器 的 跟踪 记忆 

等 模式 

。 具 有 一 个 图 形 存储 器 监视 器 ， 可 以 显示 MARIE 中 的 4096 个 地 址 

“可 以 实现 MARIE 寄存 器 的 图 形 显示 

“在 程序 执行 过 程 中 ， 会 高 亮 显示 正在 执行 的 指令 

。 具 有 用 户 可 控制 的 执行 速度 

。 显 示 状 态 信息 

“。 用户 可 见 的 符号 表 

。 一 个 交互 型 的 汇编 器 ， 用 户 可 以 纠正 各 种 错误 ， 并 且 自 动 重新 进行 汇编 ， 而 无 需 改 变 汇编 环境 

。 具 有 在 线 帮助 

。 具 有 可 选 的 存储 器 清除 功能 ， 用 户 可 以 指定 存储 器 的 范围 

.。 用 户 可 以 修改 页 帧 的 大 小 

。 具 有 一 个 小 的 学 习 模 仿 曲 线 功能 ， 学 生 可 以 很 快 学 会 系统 的 原理 和 操作 

MarieSim 采用 JavaTM 语 言 编写 ， 这 个 系统 可 以 移植 到 任何 一 个 可 运行 JavaT™M 虚 拟 机 (JVM) 的 
工作 平台 上。 使 用 Java 诸 言 的 学 生 可 能 希望 可 以 阅读 仿真 器 的 源 代码 ， 并 且 甚 至 对 模型 的 简单 功能 进 
行 某 种 改进 或 添 增 。 

图 P-2 为 MarieSim 的 图 形 界 面 ， 即 一 个 MARIE 机 器 仿真 器 的 图 形 界 面 。 显 示 屏 由 4 部 分 组 成 : 
菜单 条 、 中 间 的 显示 区 域 、 存 储 器 监视 器 和 信息 显示 区 域 。 

选择 菜单 让 用 户 可 以 控制 MARIE 机 器 仿真 器 的 各 种 动作 和 行为 。 这 些 选择 菜单 包括 对 用 MARIE 
汇编 语言 书写 的 程序 执行 装 人 人、 开始、 停止 、 没 置 斯 点 和 暂 定 等 操作 。 

MARIE 仿真 器 可 以 详细 展示 程序 的 汇编 、 装 人 和 执行 过 程 ， 所 有 这 些 操作 都 在 一 个 简单 的 环境 
下 完成 。 用 户 可 以 从 程序 中 直接 看 到 汇编 语言 的 语句 ， 同 时 可 以 看 到 对 应 的 等 效 机 器 代码 十 六 进 制 
形式 )。 同 时 也 显示 出 这 些 指令 的 地 址 ， 用 户 可 以 在 任意 时 刻 都 观察 到 存储 器 的 任何 部 分 的 内 容 。 高 亮 
度 部 分 用 来 显示 程序 最 初 装 入 的 地 址 ， 以 及 程序 运行 时 正在 执行 的 各 条 指令 。 寄 存 器 和 存储 器 采用 图 
形 显示 ， 学 生 们 可 以 观察 到 指令 是 如 何 导 致 寄存 器 和 存储 器 中 的 数值 发 生 改 变 。 


如 果 你 发 现 错误 


我 们 力图 使 本 书 在 技术 上 尽 可 能 正确 。 尽 管 本 书 的 手稿 经 过 了 反复 校对 ， 但 错误 是 难免 的 。 我 们 
非常 感谢 读者 对 本 书 任何 需要 纠正 的 错误 的 反馈 。 欢迎 读 者 将 您 的 意见 和 建议 发 送 至 电子 邮件 
ECOA @jbpub. com 。 





图 P-2 MarieSim 的 图 形 界面 


致谢 


很 少 有 书籍 可 以 由 一 两 个 人 单独 完成 ， 本 书 也 不 例外 。 现 在 ， 我 们 意识 到 编写 教材 是 一 项 十 分 艰 
巨 的 任务 ， 并 且 需 要 许多 人 的 共同 努力 。 这 里 ， 很 难 对 帮助 本 书 完成 的 每 个 人 一 一 致谢 。 因 此 ， 如 果 
由 于 我 们 的 朴 忽 在 下 面 的 致谢 有 遗漏 的 话 ， 在 此 深 表 娄 意 。 

多 年 来 选修 计算 机 组 成 与 体系 结构 课程 的 全 体 学 生 ， 都 对 本 书 的 各 个 主题 内 容 提 供 了 非常 有 价值 的 
反馈 意见 。 我 们 特别 感谢 使 用 本 教材 初级 版 本 的 同学 ， 感 谢 他 们 在 发 现 错误 时 表现 出 来 的 宽容 和 细心 。 

许多 人 都 仔细 阅读 了 本 书 的 手稿 ， 并 且 提 出 了 宝贵 的 意见 。 这 里 ， 要 特别 感谢 Marry Creel 和 
Hans Royer。 同 样 非常 感谢 花费 时 间 和 精力 审阅 本 书 的 评论 家 。 他 们 除了 提出 了 许多 很 好 的 建议 外 ， 
还 保证 了 本 书 内 容 的 质量 。 他 们 是 : Victor Clincy (Kennesaw 州立 大 学 ) 、Robert Franks (Central 学 
院 )、Karam Mossaad (Texas 大 学 Austin 学 院 ) 、Michael Schulte (Missouri 大 学 ，St. Louis) 、Peter 
Smith (CSU Northridge)、Xiaobo Zhou (Wayne 州立 大 学 )。 

这 里 ， 还 要 特别 感谢 Karishma Rao， 她 为 设计 一 个 高 质量 的 存储 器 软件 模块 付出 了 艰苦 努力 。 

Jones 和 Bartlett 出 版 社 的 工作 人 员 为 本 书 出 版 做 了 出 色 工 作 ， 他 们 中 的 每 一 个 人 都 应 该 得 到 特别 
的 感谢 。 包 括 Amy Rose、Theresa DiDonato、Nathan Schultz 和 J. Michael Stranz。 

我 个 人 ，Linda Null,， 在 此 要 感谢 我 的 丈夫 Tim Wahls， 这 期 间 ， 他 的 日 常生 活 中 成 为 了 “ 书 的 丈 
夫 ”， 感 谢 他 的 非凡 耐心 ,聆听 有 关 本 书 的 各 种 评论 并 坦率 地 发 表 对 书籍 内 容 的 各 种 意见 。 感 谢 他 在 我 
编写 本 书 期 间 ， 承 担 了 全 部 做 饭 之 类 等 生活 琐事 。 我 个 人 认为 我 嫁 了 一 个 非常 好 的 男人 。 这 里 还 要 囊 心 感谢 
我 的 导师 Merry MeDonald， 他 教 给 我 学 习 和 教学 的 价值 和 快乐 ， 并 且 全 身心 地 投入 到 学 习 和 教学 工作 中 。 
最 后 ， 我 要 向 Julia Lobuir 致 以 最 衷心 的 感谢 。 没 有 她 的 参与 ， 本 书 和 本 书 使 用 的 各 种 软件 都 不 可 能 实现 。 

我 个 人 ，Julia Lobur， 非 常 感谢 我 的 合作 伙伴 Marla Cattermole。 她 的 耐心 和 真诚 使 得 我 可 以 完成 
本 书 的 工作 。 她 精湛 的 厨 艺 使 我 大 饱 口 福 ， 而 她 丰富 的 智慧 更 使 我 受益 菲 浅 。 她 在 事业 上 勤奋 努力 ， 
争取 更 高 的 学 位 。 她 的 行为 不 断 鞭 策 我 ， 不 得 有 丝毫 的 松懈 。 我 同样 要 向 Linda Null 表达 我 最 深 致 的 
谢意 。 首 先 敬佩 她 在 计算 机 科学 教育 领域 无 与 伦比 的 热忱 和 投入 ， 以 及 她 对 学 生 们 的 无 私 奉献 。 然 后 ， 
感谢 她 给 了 我 这 样 一 个 机 会 ， 与 她 一 起 分 享 创 作 本 书 那 种 难以 言 表 的 经 历 。 
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计算 不 再 只 是 计算 机 的 事情 ， 它 已 经 渗透 到 人 类 生活 的 方方面面 …… 不 难看 到 ， 计 算 机 已 经 从 巨大 的 空 
调 房间 移 到 了 我 们 的 眼前 ， 又 搬 到 我 们 的 办 公 桌 上 ， 现 在 又 置 于 我 们 的 膝 头 ， 并 装 进 我 们 的 口 发 里 。 不 仅 如 
此 ， 所 有 这 些 变化 还 远 远 没 有 结束 …… 就 像 自然 规律 一 样 ， 数 字 时 代 的 进步 是 无 法 抗拒 或 者 停止 的 …… 信 息 
高 速 公路 在 今天 可 能 是 最 令 人 眼花 睁 乱 的 词语 ， 但 对 于 未 来 它 可 能 只 是 一 种 保守 的 描述 ， 未 来 信息 技术 的 发 
展 可 能 会 远 超 出 人 们 现在 最 大 胆 的 预测 …… 我 们 所 期 待 的 任何 发 明 创造 正 发 生 在 我 们 的 身边 和 眼前 。 这 些 发 
明 创 造 从 本 质 上 推动 着 我 们 的 社会 朝 着 更 加 数字 化 的 方向 发 展 。 

- Nicholas Negroponte 教授 ， 美 国 麻 省 理工 学 院 (MIT) 媒体 技术 
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1.1 概述 


Negroponte 博士 是 众多 将 计算 机 革命 视 作 自然 力量 的 科学 家 之 一 。 这 种 自然 的 力量 可 以 将 人 类 带 
入 数字 化 时 代 ， 使 人 们 可 以 征服 许多 已 经 困扰 了 人 类 多 个 世纪 的 难题 ， 以 及 在 解决 这 些 原 始 难题 时 又 
出 现 的 各 种 新 问题 。 计 算 机 已 经 把 我 们 从 许多 繁琐 乏味 的 日 常 工作 中 解放 出 来 ， 这 使 得 我 们 的 集体 创 
造 潜能 得 以 解放 ， 从 而 又 可 以 建造 出 更 大 、 更 好 的 计算 机 。 

目睹 计算 机 给 人类 社会 所 带 来 的 科学 和 社会 方面 的 深刻 变化 ， 人 们 最 初 很 容易 被 计算 机 的 复杂 性 
所 完全 折服 。 而 计算 机 的 这 种 复杂 性 却 来 源 于 一 些 非常 简单 的 思想 。 正 是 这 些 简 单 的 思想 带 来 了 今天 
计算 机 的 成 就 ， 并 且 它们 也 是 未 来 计算 机 的 基础 。 至 于 这 些 思想 会 在 未 来 的 计算 机 发 展 过 程 中 起 多 大 作 
用 ， 目 前 还 只 是 各 种 各 样 的 猜测 。 可 是 在 今天 ， 正 是 这 些 简 单 的 思想 构成 了 当代 计算 机 科学 的 全 部 基础 。 

相对 计算 机 硬件 设计 而 言 ， 计 算 机 科学 家 常常 会 更 关注 编写 一 些 复 杂 的 程序 算法 。 当 然 ， 如 果 要 
使 这 些 算 法 起 作用 ， 最 终 还 是 需要 一 台 计算 机 来 执行 。 有 些 算法 过 于 复杂 ， 以 至 于 现在 的 计算 机 系统 
运行 它们 需要 太 长 的 时 间 。 这 类 算法 被 认为 在 计算 上 是 不 可 实行 的 《computationally infeasible)。 当 
然 ， 以 现在 计算 机 技术 的 创新 速度 来 看 ， 某 些 现在 不 可 行 的 事件 在 将 来 是 可 能 行 的 。 但 是 ， 无 论 将 来 的 
计算 机 系统 变 得 多 么 巨大 或 多 么 快 ， 人 们 构想 出 的 问题 ， 总 会 超出 这 种 机 器 所 能 解决 的 合理 范围 。 

要 了 解 一 个 算法 为 什么 不 可 行 ， 或 者 要 了 解 一 个 可 行 的 算法 在 执行 时 为 什么 会 运行 得 太 慢 ， 必 
须 从 计算 机 的 角度 来 看 待 这 个 程序 。 在 试图 优化 要 运行 的 程序 之 前 ， 必 须 了 解 计 算 机 系统 是 由 什么 
构成 的 。 如 果 一 开始 就 不 了 解 计 算 机 的 构造 ， 却 要 对 计算 机 系统 进行 性 能 优化 ， 那 就 如 同 往 汽 车 油 
箱 里 灌注 万 金 油 来 调整 汽车 。 如 果 这 样 处 理 后 ， 汽 车 还 能 行驶 ， 那 真 算是 走运 了 

程序 优化 和 系统 调 优 可 能 是 人 们 学 习 计 算 机 工作 原理 的 最 重要 的 动机 。 当 然 ， 还 有 许多 其 他 的 理 
由 。 例 如 ， 如 果 要 编写 一 些 编译 程序 ， 那 么 必须 了 解 这 些 编译 程序 运行 时 所 需 的 硬件 环境 。 最 好 的 编 
译 程序 要 利用 特定 的 硬件 特性 〈 例 如 流水 线 )， 以 获取 更 快 的 运行 速度 和 更 高 的 下 作 效 率 。 

如 果 要 对 一 些 大 型 复杂 的 真实 世界 的 系统 进行 建 模 ， 那 么 就 需要 了 解 浮 点 算术 如 何 工 作 及 其 实际 
工作 方式 。 而 如 果 要 设计 计算 机 外 围 设 备 ， 或 者 是 外 围 设备 的 驱动 程序 ， 则 必须 知道 某 台 特 定 计 算 机 
如 何 处 理 其 输入 /输出 〈IMO) 的 每 个 细节 。 如 果 工 作 内 容 涉 及 内 人 式 系统 ， 那 么 还 要 知道 这 些 系统 通 
常 都 是 资源 约束 的 〈resource-constrained) 。 对 时 间 、 空 间 和 价格 权衡 ， 以 及 /QO 结构 的 理解 ， 对 我 们 
的 职业 发 展 是 至 关 重要 的 。 

所 有 计算 机 专业 人 员 都 应 该 熟悉 有 关 计 算 机 基准 测试 (benchmarking) 的 一 些 基本 概念 ， 并 能 够 
解释 和 表示 这 些 基准 测试 系统 所 产生 的 结果 。 从 事 硬 件 系统 、 网 络 或 程序 算法 研究 的 专家 们 会 发 现 ， 
基准 测试 技术 对 于 日 常 工 作 至 关 重 要 。 人 负责 采购 硬件 的 技术 经 理 们 也 会 使 用 基准 测试 技术 来 帮助 他 们 在 
给 定 的 经 费 内 购买 到 最 好 的 系统 ， 他 们 深 知 利用 性 能 基准 测试 这 种 方法 可 以 发 现 有 利于 特定 系统 的 结果 。 

前 面 所 列举 的 例证 说 明了 这 样 一 种 思想 ， 即 在 计算 机 硬件 和 计算 机 系统 的 软件 部 分 及 计算 机 编程 
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的 各 个 方面 之 间 存 在 着 基本 的 联系 。 因 此 ， 作 为 计算 机 科学 家 ， 不 管 其 技术 领域 如 何 ， 了 解 便 件 和 软 
件 之 间 的 相互 作用 是 十 分 必要 的 。 同 时 ， 也 应 该 熟悉 怎样 把 不 同 的 电路 和 元 部 件 组 合 在 一 起 ， 来 创建 
有 效 的 计算 机 系统 。 为 此 ， 需 要 学 习 计 算 机 组 成 《computer organization) 。 计 算 机 组 成 所 强调 的 是 有 
关 控 制 信 号 〈 即 怎样 控制 计算 机 ) 、 信 号 传递 方式 ， 以 及 存储 器 类 型 等 问题 。 它 涵盖 了 有 关 计 算 机 系统 
的 物理 构成 的 各 个 方面 。 这 部 分 的 内 容 将 有 助 于 回答 这 样 一 个 问题 : 计算 机 怎样 工作 ? 

另 一 方面 ， 计 算 机 体系 结构 〈computer architecture) 则 集中 讨论 计算 机 系统 的 结构 和 行为 ， 主 要 
涉及 的 是 程序 员 所 熟悉 的 系统 实现 的 逻辑 方面 的 内 容 。 计 算 机 体系 结构 包括 许多 基本 要 素 ， 如 指令 集 
和 指令 格式 、 操 作 码 、 数 据 类 型 、 寄 存 器 的 数目 和 类 型 、 寻 址 方式 、 主 存储 器 的 访问 方式 和 各 种 输入 / 
输出 机 制 等 。 系 统 的 体系 结构 会 直接 影响 到 各 种 程序 的 逻辑 执行 过 程 。 学 习 计 算 机 体系 结构 将 有 助 于 
回答 另外 -- 个 问题 : 怎样 设计 一 台 计算 机 ? 

对 于 特定 的 计算 机 来 说 ， 计 算 机 体系 结构 就 是 其 各 硬件 部 分 的 组 合 ， 再 加 上 其 指令 集体 系 结构 
(instruction set architecture, ISA)。ISA 是 在 机 器 上 运行 的 所 有 软件 和 执行 这 些 软件 的 硬件 之 问 的 协定 
接口 。ISA 实现 了 人 机 对 话 。 

计算 机 组 成 和 计算 机 体系 结构 之 间 的 区 别 很 难 清 晰 地 加 以 界定 。 对 于 哪些 概念 属于 计算 机 组 成 ， 
哪些 概念 属于 计算 机 体系 结构 ， 计 算 机 科学 和 计算 机 工程 领域 的 人 员 持 有 不 同 的 观点 。 事 实 上 上 ， 无 论 
是 计算 机 组 成 ， 还 是 计算 机 体系 结构 ， 都 不 是 孤立 的 。 它 们 之 间 相 互 关联 、 相 互 依赖 。 只 有 在 全 面 了 
解 这 两 部 分 内 容 之 后 ， 才 能 真正 理解 它们 。 对 计算 机 组 成 和 体系 结构 的 理解 ， 最 终 将 引导 人 们 对 计算 
机 和 计算 有 更 深入 的 了 解 ， 计 算 机 和 计算 才 是 计算 机 科学 的 精 敌 。 


1.2 计算 机 的 主要 组 成 部 分 


虽然 我 们 很 难 区 分 哪些 概念 属于 计算 机 组 成 ， 哪 些 概念 属于 计算 机 体系 结构 ,但 我 们 要 说 出 计算 
机 硬件 问题 会 在 哪里 结束 ， 软 件 问 题 从 哪里 开始 是 几乎 不 可 能 的 。 通常 ， 计 算 机 科学 家 们 会 使 用 某 种 
计算 机 诸 言 (比如 Java 或 C 语 言 ) 来 编写 一 些 计算 机 程序 ， 以 实现 各 种 设计 算法 。 也 许 大 家 会 问 ， 是 
什么 使 得 这 些 算法 程序 运行 呢 ? 答案 是 ， 当 然 是 另外 一 种 算法 ! 并 且 ， 又 会 有 其 他 一 种 算法 来 执行 和 
实现 该 算法 。 依 此 类 推 ， 一 直 向 下 到 机 器 层 ， 这 种 机 器 层 可 以 看 作 是 由 电子 设备 实现 的 一 种 算法 。 内 
此 ， 现 代 的 计算 机 实际 上 就 是 执行 其 他 算法 的 算法 实现 的 过 程 。 这 种 符 套 的 算法 链 可 以 导出 下 面 的 
原理 : 

硬件 和 软件 等 效 原理 : 任何 可 以 利用 软件 实现 的 事情 可 以 利用 硬件 来 实现 。 反 之 ， 任 何 可 以 

利用 硬件 来 实现 的 事件 也 同样 可 以 利用 软件 来 实现 ”。 


通常 ， 人 们 可 以 设计 一 台 专用 计算 机 来 执行 的 各 种 工作 任务 ， 比 如 文字 处 理 ， 预 算 分 析 ， 或 者 是 用 来 
玩 一 个 友好 的 Tetris 游戏 。 同 样 ， 也 可 以 编写 一 些 程序 来 实现 专用 计算 机 的 各 种 功能 ， 如 实现 放置 在 
汽车 内 或 微波 炉 中 的 嵌 人 式 系统 的 功能 。 有 时 ， 人 们 常常 会 看 到 这 样 的 情形 ， 一 个 简单 的 振 和 人 式 系统 
会 比 一 个 复杂 的 计算 机 程序 表现 出 好 得 多 的 性 能 。 而 在 另外 一 些 场合 ， 人 们 又 会 发 现 ， 计 算 机 程序 却 
是 首选 方法 。 硬 件 和 软件 的 等 效 原理 说 明 ， 可 以 用 不 同 的 选择 来 实现 相同 的 计算 机 功能 。 学 习 计算 机 
组 成 和 结构 的 知识 将 有 助 于 做 出 最 佳 选择 。 

下 面 先 从 构成 一 个 计算 系统 所 必需 的 基本 部 件 开始 ， 讨 论 计 算 机 的 硬件 问题 。 在 最 基本 的 层次 上 ， 
计算 机 通常 由 下 面 三 部 分 组 成 : 

1. 用 来 解释 和 执行 程序 的 处 理 器 。 

2. 用 来 存储 数据 和 程序 的 存储 器 。 

3. 与 外 界 进行 数据 传输 的 机 制 。 

本 书 将 在 随后 的 章节 中 详细 讨论 这 三 部 分 与 计算 机 硬件 有 关 的 内 容 。 





”这 一 原理 没有 强调 等 效 任务 执行 的 速度 问题 。 一 般 来 说 ,硬件 实现 的 速度 总 是 快 得 多 。 
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如 果 能 够 从 各 分 立 部 件 的 角度 来 理解 计算 机 ， 那 么 就 应 该 可 以 了 解 系统 在 任意 时 刻 的 行为 ， 并 且 
还 可 以 知道 怎样 根据 需要 改变 系统 的 行为 。 有 时 ， 似 乎 很 难 想像 人 和 计算 机 系统 有 什么 共同 之 处 。 但 
下 面 的 比喻 也 许 不 算 太 牵 强 附 会 。 设 想 一 下 ， 怎 样 利用 一 个 坐 在 教室 里 的 学 生来 展示 计算 机 的 三 大 部 
件 : 该 学 生 的 大 脑 对 应 处 理 器 ， 所 记 的 笔记 代表 存储 器 ， 而 用 来 记 笔记 的 笔 就 是 输入 /输出 〈IO) 机 制 。 
需要 记 住 的 是 ， 人 的 能 力 要 远 远 超过 当今 世界 现 有 的 、 或 在 可 见 的 将 来 能 够 建造 的 任何 计算 机 系统 。 


1.3 计算 机 系统 示例 


本 书 将 引入 一 些 计算 机 的 专用 词汇 。 有 些 术 语 可 能 易于 混淆 ， 不 够 严密 ， 或 有 些 牵强 附会 。 不 过 ， 
稍 加 解释 之 后 ， 相 信 读 者 就 可 以 明确 这 些 概念 。 

作为 讨论 ， 下 面 来 看 一 个 计算 机 广告 ( 见 图 1-1) 。 这 是 大 量 计 算 机 广告 中 的 一 个 典型 例子 ， 它 
使 用 了 “64 MB SDRAM”、“64-bit PCI sound card” 和 “32 KB Ll cache” 等 诸如 此 类 的 广告 词语 来 
对 读者 进行 宣传 推销 。 如 果 对 此 类 术语 没有 一 定 的 了 解 ， 很 难 判断 购买 广告 中 所 推销 的 商品 是 否 是 
明智 之 举 ， 其 至 也 不 太 清 楚 该 系统 能 否 满足 我 们 的 需求 。 随 着 本 书 的 介绍 ， 你 将 会 学 习 到 那些 隐藏 
在 这 类 专业 术语 后 面 的 基本 概念 。 


FOR SALE: OBSOLETE COMPUTER — CHEAP! CHEAP! CHEAP! 


* Pentium Ill 667 MHz 

* 133 MHz 64MB SDRAM 

* 32KB L1 cache, 256KB L2 cache 

* 30GB EIDE hard drive (7200 RPM) 
“48X max variable CD-ROM 

* 2 USB ports, 1 seria}l port, 1 parallel port 


» 19" monitor .24mm AG, 1280 x 1024 at 85Hz 
* Intel 3D AGP graphics card 

。 56K PCI! voice modem 

* 64-bit PCI sound card 





图 1-1 一 个 典型 的 计算 机 广告 

在 解释 这 个 广告 之 前 ， 我 们 还 需要 讨论 一 些 更 基本 的 概念 : 这 就 是 我 们 在 学 习 计 算 机 知识 的 过 程 
中 将 会 遇 到 的 有 关 测 量 方面 的 专门 术语 。 

可 以 说 ， 在 科学 技术 的 各 个 领域 都 有 自己 测量 事物 的 方法 ， 计 算 机 领域 当然 也 不 例外 。 计 算 机 行 
业 的 人 们 相互 之 间 可 以 讨论 某 些 事情 有 多 大 ， 或 某 些 事情 有 多 快 。 为 此 ， 他 们 必须 使 用 相同 的 测量 单 
位 。 在 谈 到 一 些 计算 机 事物 的 大 小 时 ， 常 常会 使 用 千 、 百 万 、 十 亿 或 万 亿 字 符 数 来 描述 。 图 1-2 中 左 
侧 给 出 了 这 些 测量 术语 的 前 级 和 它们 所 代表 的 意义 。 我 们 会 看 到 ， 计 算 体系 中 以 2 为 底 的 宕 指数 常 党 
会 比 以 10 为 底 的 宕 指数 更 加 重要 。 然 而 ， 对 多 数 人 来 说 ，10 的 宕 指数 更 容易 理解 。 因 此 ， 这 些 测 量 
的 前 缀 所 表示 的 大 小 ,在 图 中 同时 用 10 的 寡 指 数 和 2 的 寡 指 数 给 出 。 因 为 1000 与 20 (1024) 的 值 接 
近 ， 可 以 近似 地 用 2 的 10 次 方 表示 。 在 计算 机 测量 的 体系 中 使 用 的 前 缀 通常 采用 以 2 为 基 的 系统 ， 而 
不 是 以 10 为 基 的 系统 。 例 如 ， 一 个 千 字 节 (KB) 的 存储 器 是 一 个 典型 的 1024 字 节 存储 器 ， 而 不 是 
1000 字 节 的 存储 器 。 然 而 ，1GB 的 磁盘 驱动 器 实际 上 可 能 是 10 亿 字 节 ， 而 不 是 Bo 和 撑 似 10.7 亿 阮 
因此 ， 我 们 应 该 仔细 阅读 制造 商 印刷 的 参数 说 明 来 确定 1K、1KB 或 1GB 所 表示 的 准确 数值 . 

”在 讨论 某 些 事情 的 快慢 时 ， 通 常 利用 秒 钟 的 分 数 来 描述 ， 如 千 分 之 一 秒 、 百 万 分 之 一 秒 、 十 亿 分 
之 一 秒 ， 或 万 亿 分 之 一 秒 。 图 1-2 中 右 侧 给 出 了 这 类 有 关 快 慢 测 量 的 前 级 。 注意 图 中 右 侧 的 分 数 前 
级 与 左 侧 的 大 小 前 缀 的 互 为 倒 指数 ; 因此 ， 如 果 有 人 说 一 个 操作 需要 百 万 分 之 一 秒 完成 ， 那 也 就 表示 
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在 1 秒 内 可 以 有 一 百 万 个 该 种 操作 发 生 。 当 谈 及 1 秒 内 有 和 多少 次 事件 发 生 时 ， 需 要 使 用 前 级 mega-。 而 
在 讨论 操作 执行 快慢 时 ， 要 采用 前 缀 micro-。 























Kilo-(k) (1 thousand= 10’ 221) | Milli-(m) (1 thousandth=10 22 10) 
Mega-( M) (1 million= 10 2~22) | Micro p) (1 millionth=10° ‘2~2 20) 
Giga-(G) (1 billion= 10? 2%) | Nano-(n) (1 billionth 一 10-9<z2 30) 
Tera-(T) (1 trillion= 10 :22%) | Pico-(p) (1 trillionth=107!?22740) 
Peta(P) (1 quadrillion=10! 250) | Femto(D (1 quadrillionth—10 Sas2 2) 








图 1-2 与 计算 机 组 成 与 体系 结构 有 关 的 通用 前 缀 


现在 可 以 对 上 述 广告 加 以 解释 说 明 ， 微 处 理 器 是 计算 机 中 实际 执行 程序 指令 的 一 个 部 件 ， 是 系统 
的 大 脑 。 广 告 中 的 微 处 理 器 为 Pentium IH (奔腾 I) ， 工 作 频 率 为 667MHz。 每 个 计算 机 系统 中 都 包含 
一 个 时 钟 ， 用 来 保证 整个 系统 的 同步 。 系 统 时 钟 同时 向 计算 机 的 各 个 主要 部 件 送 出 电 脉冲 信号， 以 确 
保 数 据 和 指令 准确 地 按时 到 达 指 定 的 位 置 。 系 统 时 钟 在 每 秒 钟 内 发 射 的 脉冲 数目 就 是 时 钟 的 频率 ， 时 
钟 频率 的 度量 单位 为 每 秒 周 数 ， 或 称 为 赫 交 (hertz)。 因 为 计算 机 系统 的 时 钟 每 秒 产 生 几 百 万 次 的 脉 
冲 ， 也 就 是 说 计算 机 工作 在 兆赫 兹 (megahertz，MHz) 范围 。 当 今 的 许多 计算 机 都 工作 在 千 兆 赫 效 
(gigahertz，GHz) 范围 ， 即 系统 的 时 钟 要 产生 每 秒 数 十 亿 次 的 脉冲 。 没 有 微 处 理 器 的 参与 ， 计 算 机 系 
统 将 无 法 工作 。 因 此 ， 微 处 理 器 的 时 钟 频率 的 大 小 对 整个 系统 的 工作 速度 至 关 重 要 。 广 告 中 的 微 处 理 
器 的 工作 频率 是 每 秒 677 兆 周 ， 所 以 销售 商 声称 该 计算 机 系统 工作 在 677 MHz。 

然而 ， 微 处 理 器 工作 在 677 MHz 这 个 事实 ， 并 不 一 定 表示 该 系统 可 以 在 每 秒 钟 内 执行 677 兆 条 指 
令 ， 换 句 话 说 每 条 指令 执行 所 需要 的 时 间 为 1.5 纳 秒 。 在 本 书 的 后 续 章 节 ， 读 者 可 以 了 解 到 每 条 计算 
机 指令 的 执行 需要 若干 个 固定 的 时 钟 周 期 。 有 些 指令 的 执行 只 需要 一 个 时 钟 周期 ， 但 是 大 多 数 指令 所 
需要 时 间 都 多 于 一 个 时 钟 周 期 。 很 明显 ， 一 个 微 处 理 器 每 秒 钟 实 际 执行 的 指令 数目 与 微 处 理 器 的 系统 
时 钟 的 速度 成 正比 〈proportionate) 。 执 行 一 条 特定 的 机 器 指令 所 需要 的 时 钟 周 期 的 数目 同时 也 是 机 器 
组 成 与 体系 结构 的 函数 。 

接 下 来 ， 广 告 中 的 参数 是 “133 MHz 64MB SDRAM”。133 MHz 表示 系统 的 总 线 速 度 ， 系 统 总 线 
是 计算 机 内 部 各 部 件 间 的 一 组 电学 连 线 ， 用 来 在 系统 内 部 传递 数据 和 指令 。 与 微 处 理 器 一 样 ， 系 统 的 
总 线 速 度 也 采用 MHz 来 量度 。 许 多 计算 机 都 有 一 条 特殊 的 局 部 总 线 ， 支持 非 常 高 速 的 数据 传递 〈 例 
如 视频 信号 传送 所 需要 的 高 速 数 据 传递 )， 这 种 局 部 总 线 是 直接 连接 处 理 器 和 存储 器 的 高 速 通道 。 系 统 
的 总 线 速度 最 终 成 为 制约 系统 的 信息 传 载 能 力 的 上 限 。 

广告 中 的 宣传 还 夸 炊 说 ,系统 有 64 兆 字 节 (MB) 的 存储 容量 ,或 者 说 存储 64 兆 字符 的 容量 。 存 
储 器 的 容量 不 但 决定 了 可 以 运行 的 程序 大 小 ， 而 且 也 决定 了 可 以 同时 运行 且 不 会 使 计算 机 陷 人 停顿 的 
程序 数目 。 计 算 机 的 应 用 程序 ， 或 者 操作 系统 制造 商 通 常会 对 其 产品 的 运行 推荐 所 需要 的 内 存 大 小 
(有 时 ， 这 些 推 荐 说 明 可 能 会 过 于 保守 ， 这 就 需要 你 仔细 思考 所 看 到 的 数据 )。 

除了 介绍 存储 器 的 大 小 外 ， 广 告 推销 的 系统 还 说 明了 存储 器 的 类 型 ，SDRAM， 同 步 动态 随机 存储 
器 (synchronous dynamic random access memory)。SDRAM 比 传 统 ( 异 步 ) 的 存储 器 要 快 得 多 ， 原 央 
在 于 这 类 存储 器 可 以 与 微 处 理 器 的 总 线 同 步 运 行 。 在 这 类 写 人 操作 中 ，SDRAM 总 线 只 能 与 运行 在 
200MHz 和 200MHz 以 下 频率 的 总 线 实现 同步 。 新 的 存储 器 技术 ， 比 如 RDRAM (Rambus DRAM) 和 
SLDRAM (SyncLink DRAM)， 则 要 求 系统 的 运行 速度 要 比 总 线 速度 快 。 
计算 机 内 部 结构 一 览 

你 想 知道 计算 机 内 部 到 底 是 什么 样子 吗 ? 下 面 举例 给 出 了 现代 个 人 计算 机 (PC) 的 组 成 部 分 。 然 
而 ， 当 打开 计算 机 内 部 ， 试 图 寻找 和 辨认 各 个 不 同 的 计算 机 部 件 时 ， 却 是 一 件 很 让 人 头痛 的 事情 ， 即 
使 你 已 经 熟悉 了 各 个 部 件 及 其 功能 。 

打开 计算 机 的 机 箱 ， 首 先 会 看 到 一 个 装 有 风扇 的 金属 盒 ， 这 是 电源 。 我 们 还 可 以 看 到 各 种 驱动 器 ， 
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包括 硬盘 驱动 器 ,也许 还 有 软盘 驱动 器 和 CD-ROM 或 DVD 驱动 器 。 计 算 机 内 部 包含 许多 集成 电路 : 
- 些 长 着 多 条 腿 的 黑色 的 小 方块 的 电子 元 件 。 还 会 看 到 系统 中 有 一 些 电 路 ,或 者 说 总 线 。 一 块 较 大 的 
计算 机 电路 主板 安装 在 卧 式 PC 机 的 底部 ， 或 者 是 立 式 PC 机 的 侧面 。 机 箱 中 还 有 其 他 一 些 印 刷 电路 板 
( 称 为 扩展 板 ) 插 在 主板 的 上 面 的 各 个 插 槽 中。 由 印刷 电路 组 成 的 主板 通过 总 线 把 计算 机 中 的 所 有 部 件 
连接 在 一 起 ， 包 括 CPU、RAM 和 ROM 存储 器 ， 以 及 其 他 各 种 基本 部 件 。 相 对 而 言 ， 主 板 上 的 部 件 
是 最 难 辨认 的 。 示 例 图 为 一 个 Intel D850 主板 的 照片 ， 其 中 的 各 主要 部 件 都 作 了 标注 。 

主板 顶部 的 输入 /输出 (1/O) 端口 用 来 沟通 外 部 世界 与 计算 机 之 间 的 通信 联系 。 通 过 I/O 控制 器 
的 集 线 连接 器 ， 可 以 将 计算 机 的 多 个 部 件 连接 起 来 ， 进 行 协调 工作 而 不 产生 冲突 。PCI 插 槽 可 以 插入 
不 同 PCI 设备 的 扩展 板 ， 而 AGP 连接 器 则 是 为 AGP 图 形 卡 的 接 揪 而 设计 的 。 主 板 上 有 两 个 RAM 存 
储 器 排列 区 和 一 个 存储 器 的 集 线 连接 器 。 照 片 中 的 主板 上 并 没有 接 插 处 理 器 芯片 ， 但 有 一 个 处 理 器 
(CPU) 的 插座 。 所 有 的 计算 机 都 有 一 个 内 置 电池 ， 如 照片 的 左下 角 所 示 。 主 板 上 还 有 两 个 IDE 连接 
器 的 插 槽 和 软盘 控制 器 接口 。 电 源 直接 连接 到 主板 的 电源 插座 上 。 

在 对 计算 机 内 部 进行 细致 观察 研究 时 ， 要 注意 一 些 警告 。 打 开 计 算 机 箱 盖 之 前 ， 必 须 考虑 安全 
因素 ， 这 对 你 和 机 器 都 很 重要 。 可 以 采取 下 面 的 一 些 措施 避免 可 能 出 现 的 各 种 危险 。 首 先 ， 也 是 最 
重要 的 ， 要 确保 打开 计算 机 之 前 ， 机 器 的 电源 已 经 关闭 。 建 议 把 电源 插头 留 在 插座 上 ， 这 样 可 以 提 
供 一 条 释放 静电 的 通路 。 另 外 ， 在 打开 计算 机 箱 盖 和 接触 里 面 的 任何 元 件 之 前 ， 应 该 先 确 认 操 作者 
的 身体 是 否 已 经 适当 进行 了 接地 处 理 ， 以 保证 身体 的 静电 不 会 损害 计算 机 内 部 的 任何 元 件 。 机 器 的 
许多 边缘 部 分 如 箱 盖 和 主板 边缘 ， 都 很 尖锐 ， 操 作 时 应 该 加 以 小 心 。 在 插入 新 的 扩展 卡 ， 或 是 移 
走 原 有 的 扩展 卡 又 重新 安装 时 ， 都 需要 小 心地 将 各 种 扩展 卡 插 到 所 对 应 的 插 槽 中 ， 以 避免 损坏 扩展 
卡 和 主板 插 槽 。 耳 

接 下 来 的 一 行 广告 词 ; “32 KB Ll cache, 256 KB L2” 所 描述 也 是 一 种 类 型 的 存储 器 。 在 第 6 章 
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中 ， 读 者 将 会 了 解 到 无 论 总 线 的 速度 有 多 快 ， 都 需要 一 定 的 等 待 时 间 从 内 存 中 读 取 数 据 到 微 处 理 器 。 
为 了 使 读 取 数据 的 速度 更 快 ， 许 多 计算 机 都 设计 了 一 种 特殊 的 存储 器 ， 称 为 高 速 缓存 〈cache)。 本 书 
广告 中 的 系统 有 两 种 类 型 的 高 速 缓存 : 一 级 高 速 缓存 (L1) 是 一 个 微 处 理 器 内 置 的 较 小 的 快速 存储 器 ， 
用 来 提高 对 经 常 使 用 的 数据 存 取 速 度 。 二 级 高 速 缓存 〈L2) 是 一 组 位 于 主 存储 器 和 微 处 理 器 之 间 的 快速 
存储 器 。 注 意 ， 这 里 的 高 速 缓存 的 存储 容量 是 KB 数量 级 ， 远 小 于 主 存储 器 。 第 6 章 将 详细 介绍 高 速 组 
存 的 工作 方式 ， 读 者 会 看 到 大 容量 的 高 速 缓存 并 不 总 是 最 好 的 。 

男 一 方面 ， 对 于 硬盘 来 说 ， 却 是 希望 容量 越 大 越 好 。 广 告 中 的 系统 有 30GB 的 硬盘 ， 还 是 很 有 了 吸 
引力 的 。 但是， 硬盘 的 存储 容量 并 不 是 唯一 要 考虑 的 因素 。 如 果 对 于 主机 来 说 ， 硬 盘 的 访问 速度 太 慢 
的 话 ， 大 容量 的 硬盘 也 无 助 于 系统 速度 的 提高 。 这 里 的 硬盘 驱动 器 的 转速 是 7200 RPM (单位 : 每 分 
钟 转 数 )。 对 于 有 这 类 知识 的 读者 来 说 ,该 数据 指出 (虽然 不 十 分 明显 )， 这 是 一 个 比较 快 的 硬盘 驱动 
融 。 除 了 利用 转速 来 表示 硬盘 的 快慢 外 ， 通 常 还 可 以 采用 访问 磁盘 上 的 数据 平均 所 需要 的 毫秒 数 来 描 
述 硬 盘 的 速度 。 | 

硬盘 的 转速 是 决定 硬盘 综合 性 能 的 关键 因素 之 一 。 然 而 ， 硬 盘 与 系统 的 其 他 部 分 的 连接 方式 ,或 
称 接口 ， 也 是 很 重要 的 。 广 告 中 的 系统 硬盘 采用 的 一 种 称 为 EIDE 的 硬盘 接口 ， 即 增强 型 集成 驱动 电 
子 接口 (enhanced integrated drive electronics)。 对 于 高 密度 存储 设备 而 言 ，EIDE 是 一 种 高 性 价 比 的 硬 
件 接口 。EIDE 包含 特殊 的 电子 线路 ， 可 以 用 来 增强 计算 机 的 可 连接 性 、 速 度 和 存储 容量 。 巾 于 大 多 数 
的 EIDE 系统 与 微 处 理 器 和 存储 器 共享 系统 总 线 ， 因 此 硬盘 上 的 数据 存 取 也 与 系统 总 线 的 速度 有 关 。 

系统 总 线 负责 计算 机 内 部 的 数据 传递 ， 而 端口 〈port) 则 承载 了 外 部 设备 与 计算 机 之 间 的 数据 传递 。 
上 面 的 广告 描述 了 三 种 不 同类 型 端口 ,“2 USB ports，] serial port，1 parallel port”。 大 多 数 台 式 计 算 机 都 
有 两 种 数据 端口 ， 串 行 端口 (serial port) 和 并 行 端口 (parallel port) 。 串 行 端口 通过 1 条 或 2 条 数据 线 发 
送 电 脉冲 序列 来 传递 数据 。 而 并 行 端口 至 少 有 8 条 数据 线 ， 同 时 进行 并 行 数据 传输 。 该 系统 还 配备 了 一 
种 称 为 USB， 通 用 串 行 总 线 (universal serial bus) 端口 的 特殊 串 行 连接 端口 。USB 是 一 种 流行 的 外 部 总 
线 ， 它 支持 即 插 即 用 〈plug-and-play) 功能 ( 即 具 备 自动 配置 设备 的 能 力 ) 和 热 插 拔 (hot plugging) 功能 
(可 以 在 计算 机 运行 的 过 程 中 增加 或 移 除 设备 )。 

有 些 系统 的 总 线 配 备 了 专用 I/O 总 线 。 外 围 设备 互 连 (Peripheral Component Interconnect, PCI) 
就 是 这 样 一 种 专用 的 IO 总 线 ， 它 支持 多 个 外 围 设备 的 连接 。 由 Intel 公司 开发 的 PCI， 可 以 高 速 连接 
外 设 ， 同时 支持 即 插 即 用 功能 。 该 广告 介绍 了 两 种 PCI 设备 : PCI modem (调制 解 调 器 ) 可 以 连接 计 
算 机 和 因特网 (本 书 将 在 第 11 章 详 细 讨 论 modem)。 男 一 种 PCI 设备 是 声卡 ， 它 包含 了 系统 的 立体 声 
扬声器 工作 所 需要 的 一 些 电路 部 件 。 第 7 章 将 会 介绍 更 多 不 同类 型 的 输入 /输出 接口 (I/O)，1/O 总 线 
和 磁盘 存储 器 。 

在 介绍 完 端口 之 后 ， 广 告 还 提供 了 有 关 显 示 器 的 特性 ,“19”monitor，. 24mm AG，1280 X 1024 
at 85 Hz”。 虽 然 显 示 器 对 计算 机 系统 的 运行 速度 和 工作 效率 作用 很 小 ， 但 是 它 对 计算 机 使 用 者 的 舒适 
度 却 有 很 大 影响 。 该 显示 器 支持 85Hz 的 刷新 速率 (refresh rate)， 这 意味 着 显示 器 上 显示 的 图 像 在 一 
秒 钟 内 刷新 85 次 。 如 果 刷 新 速率 太 慢 ， 显 示 屏 上 的 图 像 会 出 现 令 人 不 适 的 跳动 或 波纹 现象 。 起 伏 不 稳 
定 的 显示 图 像 很 容易 造成 操作 人 员 的 眼睛 和 身体 的 疲劳 。 有 些 人 在 长 时 间 使 用 闪烁 不 定 的 显示 屏 后 ， 
甚至 可 能 会 产生 头痛 。 造 成 眼 疲 劳 的 另 一 个 原 央 是 显示 器 的 分 辨 率 太 低 。 高 分 辩 率 的 显示 器 有 着 较 清 
晰 的 视觉 和 更 精细 的 图 形 。 分 辩 率 是 按照 显示 器 的 像素 点 的 间距 来 定义 的 ， 即 两 个 最 邻近 的 同色 点 
(像素 ) 之 间 的 距离 。 像 素 点 越 小 ， 图 像 就 越 清 晰 。 广 告 中 的 显示 器 为 机 格式 〈aperture grill，AG) 结 
构 ， 可 以 达到 0. 24 上 毫米 间距 的 像 点 。 机 格式 显示 器 的 工作 原理 是 直接 引导 电子 束 打击 显示 屏 玻 璃 内 侧 
涂 囊 的 磷 光 粉 ， 来 绘制 显示 图 像 。AG 显示 器 可 以 产生 比 传统 老式 的 荫 变 技术 更 清晰 的 网 像 。 显 示 器 最 
后 由 一 个 AGP (加 速 图 形 端 口 ，accelerated graphics port) 图 形 卡 提供 接口 支持 。 这 种 Intel 公司 设计 的 图 
形 接口 特别 适合 于 3 D 图 形 显 示 。 

按照 前 面 的 讨论 ,读者 可 能 会 有 些 奇 怪 : 为 什么 显示 器 的 像素 点 的 间距 不 能 制造 成 任意 小 的 结构 ， 
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以 获得 理想 的 图 像 分 辩 率 呢 ? 原因 在 于 显示 器 刷新 速率 与 像素 点 的 间距 有 关 。 例 如 ， 刷 新 100 个 像 点 
与 刷新 50 个 像 点 相 比 需要 更 多 的 时 间 。 对 于 较 小 的 像 点 间距 ， 同 样 显示 屏 就 需要 有 更 多 的 像素 点 。 需 要 
刷新 的 点 越 多 ， 意 昧 着 每 个 刷新 周期 的 时 间 就 越 长 。 专 家 们 推荐 刷新 速率 不 小 于 75Hz。 本 广告 宣传 的 显 
示 器 的 刷新 速率 为 85Hz， 比 专家 推荐 的 最 小 值 高 10Hz (大 约 13%)。 

尽管 我 们 不 可 能 对 各 种 现 有 的 特定 品牌 的 计算 机 部 件 都 做 深入 的 研究 ， 但 在 完成 本 书 的 学 习 后 ， 
读者 可 以 了 解 到 大 多 数 计算 机 系统 的 工作 原理 。 这 些 知 识 无 论 对 于 偶尔 使 用 计算 机 的 人 士 还 是 有 经 验 
的 程序 设计 员 来 说， 都 是 很 重要 的 。 作 为 用 户 ， 我 们 需要 了 解 所 使 用 的 计算 机 系统 的 优点 和 局 限 ， 这 
样 可 以 对 计算 机 的 应 用 做 出 一 些 明 智 的 决定 ， 可 以 更 高 效 地 使 用 计算 机 。 而 作为 程序 员 ， 更 需要 准确 
地 了 解 系统 硬件 的 功能 ， 才 能 更 有 效 地 编写 各 种 功能 程序 。 例 如 ， 即 使 对 于 计算 机 硬件 中 的 一 些 简 单 
的 算法 设计 ， 例 如 主 存储 器 与 高 速 缓冲 存储 器 之 间 地 址 映射 的 算法 和 存储 器 交叉 编 址 的 方法 ， 在 决定 
采用 按 以 行为 主 ， 还 是 以 列 为 主 的 次 序 访问 数组 元 素 时 ， 硬 件 的 结构 都 会 对 程序 的 设计 产生 巨大 影响 。 

本 书 内 容 既 涉及 大 型 计算 机 ， 也 研究 了 小 型 计算 机 。 在 大 型 机 中 包括 企业 级 的 服务 器 主机 和 超级 
计算 机 。 而 小 型 机 则 包含 个 人 计算 机 、 工 作 站 和 一 些 便携 式 计算 机 设备 。 大 家 将 会 看 到 无 论 是 从 事 日 
党 的 琐碎 工作 ， 还 是 进行 复杂 的 科学 任务 ， 这 些 计 算 机 系统 的 主要 部 件 都 是 非常 相似 的 。 本 书 也 会 介 
绍 一 些 主流 计算 机 系统 之 外 的 计算 机 结构 ， 并 衷心 希望 本 书 介绍 的 知识 可 以 作为 读者 在 计算 机 组 成 与 
体系 结构 这 一 振奋 人 心 的 广阔 领域 中 继续 学 习 的 一 个 跳板 。 


1.4 国际 标准 化 组 织 


假设 你 想 购买 一 台 精 巧 的 0.24 点 距 的 AG 显示 器 。 你 可 以 多 访问 几 家 商店 ， 以 便 买 到 一 个 好 价 
格 。 设 想 一 下 ， 先 打 几 个 电话 查询 一 下 价格 ， 然 后 上 网 浏览 几 家 网 上 商店 ， 或 者 开车 在 城 里 转 一 转 ， 
一 定 可 以 找到 称心 如 意 的 产品 。 以 你 的 经 验 来 看 ， 在 任何 地 方 都 可 以 买 到 非常 适合 于 你 的 系统 的 显示 
器 。 之 所 以 可 以 做 出 这 样 的 假设 ， 是 因为 计算 机 设备 制造 商 们 都 遵守 政府 和 工业 组 织 所 建立 的 设备 互 
连 和 操作 规范 。 

某 些 标准 制定 组 织 是 一 些 特殊 的 行业 协会 ， 或 者 是 一 些 由 行业 领头 企业 组 成 的 公会 。 制 造 商 们 都 
很 清楚 ， 通 过 建立 特定 类 型 的 设备 的 共同 准则 ， 可 以 比 他 们 单独 提出 的 设备 制造 标准 有 更 大 的 市 场 ， 
各 自分 立 制 定 的 技术 规范 很 可 能 是 互 不 兼容 的 。 : 

有 些 标准 化 组 织 有 自已 正式 的 规章 ,并且 在 计算 机 和 电子 技术 的 某 些 领域 是 国际 公认 的 权威 性 组 
织 。 继 续 学 习 计算 机 组 成 与 体系 结构 的 知识 ， 无 疑 会 遇 到 这 些 国 际 标准 化 组 织 和 闭 体 制定 的 各 种 技术 
规范 ， 所 以 有 必要 对 这 些 组 织 做 一 些 介绍 。 

电子 与 电气 工程 师 协 会 (Institute of Electrical and Electronic Engineers, IEEE) 是 致力 于 电子 下 
程 和 计算 机 工程 专业 进步 的 组 织 。IEEE 积极 排 动 全 球 范 围 内 工程 领域 的 合作 ， 出 版 了 大 量 的 技术 文 
献 。IEEE 也 为 各 种 计算 机 部 件 ， 信 号 传送 协议 和 数据 表示 方法 制定 标准 ， 并 对 组 织 所 涉及 的 儿 个 领域 进 
行 各 种 技术 命名 。 对 于 新 标准 的 创建 ，IEEE 有 一 套 民 主 的 ， 却 有 些 繁琐 的 组 织 程 序 。IEEE 所 发 表 的 有 
关 标 准 的 最 终 文件 一 般 都 受到 广泛 认同 。 并 且 ， 在 文件 更 新 青 版 之 前 ， 这 些 标 准 会 持续 使 用 许多 年 。 

国际 电信 联合 会 〈International Telecommunication Union，ITU) 设立 在 瑞士 的 日 内 筷 ， 其 前 身 也 
称 为 电话 电报 国际 咨询 委员 会 (简称 CCITT)。ITU 组 织 关注 通信 系统 的 协同 性 ， 包 括 电 话 、 电 报 和 
数据 通信 系统 。ITU 已 经 建立 了 许多 通信 方面 的 标准 ， 以 后 的 学 习 中 将 会 过 到 这 类 的 一 些 标准 ,它们 
都 是 以 ITU-T, 或 者 是 机 构 的 前 身 CCITT 为 前 级 开头 的 。 

世界 上 的 许多 国家 ， 包 括 欧 共 体 ， 也 建立 了 一 些 自己 主导 的 组 织 ， 来 代表 他 们 在 国际 上 不 同 财 体 
中 的 利益 。 代 表 美 国 的 组 织 是 美国 国家 标准 学 会 (American National Standards lnstitute，ANSI) ， 面 
英国 有 自己 的 英国 标准 协会 (British Standards Institution，BSI)， 并 且 ， 在 欧洲 标准 化 委员 会 
(Comite Europeen de Normal，CEN) 中 也 有 自己 一 席 之 地 。 

国际 标准 化 组 织 (International Organization for Standardization，ISO) 则 是 一 个 协调 世界 范围 内 
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各 种 标准 化 发 展 的 机 构 ， 包 括 协调 ANSI 和 BSI 在 其 他 组 织 中 的 活动 。ISO 不 是 其 组 织 名 称 中 各 词语 
的 首 写 字母 的 缩写 ， 而 是 源 于 希腊 词 ,，“isos” 意 思 是 “相等 的 事物 ”。ISO 由 2800 个 技术 委员 会 组 成 ， 
它们 各 自负 责 一 些 全 球 性 的 标准 化 问题 ， 涉 及 的 范围 覆盖 了 从 照相 胶片 的 性 能 到 螺纹 的 间距 ， 直 到 计 
算 机 工程 的 复杂 领域 。ISO 促进 了 全 球 贸 易 的 迅速 扩展 ， 实 际 上 已 经 触及 到 人 们 生活 的 各 个 方面 。 

本 书 会 在 需要 之 处 提 到 各 个 正式 标准 的 名 称 。 至 于 大 部 分 标准 的 权威 细节 可 以 查阅 相关 组 织 的 标 
准 化 网 站 。 很 多 标准 中 还 包含 大 量 与 标准 有 关 的 参考 资料 ， 提 供 一 些 与 该 标准 相关 的 背景 知识 ， 读 者 
将 会 得 到 额外 收获 。 


1.5 计算 机 的 发 展 史 


在 过 去 的 50 年 ， 计 算 机 的 发 展 给 现代 人 类 生活 带 来 了 极 大 的 方便 。 生 活 的 记忆 也 许 会 让 人 回忆 起 
过 去 那些 使 用 速记 、 复 写 纸 和 油印 机 的 年 代 。 有 时 想起 来 ， 计 算 机 这 种 魔术 般 的 计算 机 器 似乎 是 突然 
按照 现在 人 们 所 熟知 的 形式 就 出 现 了 。 然 而 ,计算 机 的 发 展 过 程 充满 了 偶然 性 的 发 现 、 商 业 利 益 的 驱 
动 和 各 种 千奇百怪 的 念头 。 有 时 ， 计 算 机 却 是 通过 纯粹 的 工程 实践 而 获得 改进 。 尽 管 在 计算 机 的 发 展 
史上 经 历 了 各 种 各 样 的 扭曲 、 反 复 和 技术 上 的 绝境 ， 但 是 计算 机 还 是 在 以 令 人 难以 置信 的 步伐 不 断 地 
向 前 发 展 。 只 有 在 了 解 了 计算 机 的 发 展 史 后 ， 我 们 才 有 可 能 全 面 地 评价 今天 计算 机 所 取得 的 成 就 。 

下 面 ， 我 们 按照 制造 计算 机 的 技术 把 计算 机 的 发 展 划分 成 车 于 个 阶段 (或 称 为 代 ，generation)。 
这 里 ， 我 们 只 给 出 各 个 发 展 阶段 的 近似 年 代 时 间 ， 仅 供 读者 参考 。 事 实 土 ， 对 于 每 个 技术 时 代 起 始 的 
准确 时 间 ， 即 使 是 专家 们 也 很 难 达 成 一 致 的 看 法 。 

历史 上 的 每 一 项 发 明 都 带 有 当时 的 时 代 气 息 。 如 果 计 算 机 是 发 明 在 90 年 代 的 话 ， 人 们 也 许 会 奇 
怪 , 它 是 否 还 会 被 称 为 计算 机 。 事 实 上 ， 我 们 到 底 发 现 那些 放 在 桌 上 或 桌 边 的 神秘 的 盒子 做 了 多 少 计 
算 工作 呢 ? 在 不 久 以 前 ,计算机 还 只 是 用 来 为 人 们 解决 令 人 头疼 的 数学 运算 问题 。 今 天 ， 计 算 机 已 经 
不 再 只 是 为 那些 穿着 白 大 粮 的 科学 家 所 独 用 。 现 在 的 计算 机 能 够 帮助 人 们 书写 文件 ， 帮 助 相隔 千里 的 
恋人 进行 通信 ， 以 及 帮助 人 们 完成 购物 等 家 务 事 。 现 代 的 商用 计算 机 也 只 是 花费 极 少 的 一 部 分 时 间 来 
进行 有 关 财 务 账目 的 数学 计算 。 这 些 机 器 的 主要 目的 是 为 用 户 提供 大 量 商 业 策 略 方 面 的 信息 ， 以 肥 得 
竞争 上 的 优势 。 那 么 计算 机 这 个 词 现在 是 不 是 变 成 了 用 词 不 当 ? 或 者 说 是 时 代 的 错误 呢 ? 如果 不 叫 计 
算 机 ， 又 怎样 称呼 它 呢 ? 

我 们 不 可 能 用 几 页 纸 就 完整 地 陈述 计算 机 的 发 展 史 。 关 于 这 个 话题 已 经 出 版 了 好 几 本 书 。 尽 管 如 
此 ， 读 者 们 还 是 希望 了 解 某 些 更 细节 的 内 容 。 如 果 感 兴趣 的 话 ， 我 们 建议 读者 阅读 列 在 本 章 后 面 的 参 
考 书目 录 中 的 一 些 书籍 。 


1.5.1 第 零 代 : 机 械 计算 器 


在 16 世纪 以 前 ， 欧 洲 的 商人 通常 使 用 算盘 进行 各 种 计算 ， 而 用 罗马 数字 来 记录 计算 的 结果 。 后 
来 ， 十 进 制 的 计数 方法 最 终 取 代 了 罗马 数字 。 历 史上 土 曾 经 有 许多 人 发 明了 各 式 各 样 的 计算 下 具 ， 目 的 
就 是 要 使 十 进 制 数 的 计算 工作 变 得 更 加 快速 精确 。Wilhelm Schickard (1592-…1635) 由 于 第 一 个 发 明 
了 一 种 机 械 式 的 计算 器 (1642 一 1945)， 称 为 计算 钟 (Calculating Ciock ， 具 体 发 明日 期 不 详 ) ， 而 一 直 
倍 受 人 们 的 装 许 。 这 种 计算 钟 能 够 进行 多 达 6 位 数字 的 加 法 和 减法 运算 。 法 国 数学 家 帕斯卡 (Blaise 
Pascal，1623 一 1662) 也 研制 了 一 个 称 为 Pascaline 的 机 械 式 计算 器 ， 用 来 帮助 他 的 父亲 进行 税收 工作 。 
Pascaline 可 以 进行 带 进 位 的 加 法 和 减法 运算 ， 它 可 能 是 第 一 个 有 实用 目的 的 机 械 式 加 法 机 器 。 事 实 上 ， 
Pascaline 的 构思 非常 巧妙 ， 一 直到 了 20 世纪 初期 ， 其 基本 设计 思想 还 在 被 人 们 所 使 用 。 这 里 的 例证 就 
是 在 1908 年 面世 的 闪电 便携 式 加 法 器 (Lightning Portable Adder) 和 1920 年 设计 的 加 法 仪 “Addome- 
ter) 。 著 名 的 德国 数学 家 莱 布 尼 效 〈Gottfried Wilhelm von Leibniz，1646 一 1716) 发 明了 一 个 被 称 为 步 
进 式 计算 器 (Stepped Reckoner) 的 计算 工具 ， 可 以 进行 加 、 减 、 乘 、 除 四 种 运算 。 但 是 ， 所 有 的 这 些 
计算 设备 和 工具 都 不 能 进行 编程 计算 ， 也 没有 存储 器 。 在 整个 计算 过 程 中 的 每 一 步 ， 它 们 都 需要 人 的 
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尽管 像 Pascaline 这 类 的 计算 机 器 一 直 使 用 到 20 世纪 ， 但 在 19 世纪 时 就 已 经 开始 出 现 了 新 型 计算 
器 的 设计 。 在 这 些 新 型 的 设计 中 ， 最 引 人 注 目的 是 巴 贝 奇 (Charjes Babbage，1791 一 1871) 设计 的 差 
分 机 (Difference Engine) 。 直 到 现在 ， 还 有 人 称 Babbage 为 “计算 之 父 ”。 据 说 Babbage 是 一 个 行为 十 
怪 的 天 才 。 当 时 他 还 给 人 们 带 来 了 他 的 其 他 发 明 : 万 能 钥匙 (skeleton key) 和 捕 牛 器 (cow catcher)， 
一 种 用 来 将 牛 和 一 些 可 移动 的 障碍 物 推出 机 车 轨道 的 装置 。 

1822 年 ，Babbage 制造 了 差分 机 。 差 分 机 之 所 以 得 名 是 因为 它 使 用 了 一 种 被 称 为 差分 方法 〈meth- 
od of difference) 的 计算 技术 。 设 计 这 种 机 器 的 目的 是 用 来 对 多 项 式 函数 进行 机 械 式 的 求解 。 实 质 上 ， 
差分 机 本 身 是 一 个 计算 器 ， 而 不 是 计算 机 。1833 年 ，Babbage 还 设计 了 一 种 多 用 途 的 机 器 ， 称 为 分 析 
机 (Analytical Engine)。 尽 管 Babbage 生前 未 能 建造 出 他 所 设计 的 分 析 机 ， 但 是 如 果 从 设计 构造 土 来 
说 ， 分 析 机 的 功能 要 比 早期 的 差分 机 更 加 通用 。 分 析 机 已 经 具备 了 执行 任意 类 型 的 数学 运算 的 能 力 。 
分 析 机 还 包含 现代 计算 机 的 许多 部 件 ， 一 个 算术 处 理 部 件 进行 计算 工作 (Babbage 称 这 部 分 为 运算 远 
辑 部 件 ，mill)， 一 个 存储 器 (store)， 以 及 输入 和 输出 设备 。Babbage 的 设计 中 还 包含 一 个 条 件 转移 操 
作 ， 即 要 执行 的 下 一 条 指令 由 前 一 个 操作 的 结果 来 决定 。 当 时 ， 著 名 诗人 拜 伦 (Lord Byron) 的 女儿 ， 
Lovelace 伯 融 夫人 艾 达 (Ada) 曾 建 议 Babbage 编写 一 个 分 析 机 进行 数学 计算 的 原理 方案 。 这 个 方案 被 
公认 为 是 第 一 个 计算 机 程序 ， 而 Ada 则 被 视 为 是 第 一 个 计算 机 的 程序 员 。 不 仅 如 此 ， 据 说 Ada 还 提出 
了 采用 二 进 制 的 数字 体系 来 进行 数据 的 存储 ， 而 不 是 十 进 制 的 数字 体系 。 

长 期 困扰 着 早期 的 计算 机 设计 者 的 一 个 难题 是 怎样 把 数据 输入 到 计算 机 器 中 。Babbage 设计 的 分 
析 机 是 采用 一 种 穿孔 的 卡片 来 进行 数据 输入 和 编程 。 使 用 卡片 来 控制 机 器 的 思想 并 不 是 Babbage 原创 
的 ， 而 是 来 自 他 的 一 位 朋友 Joseph-Marie Jacquard (1752 一 1834)。1801 年 ，Jacquard 发 明了 一 种 可 编 
程 的 织 布 机 器 ， 可 以 在 布料 上 生成 各 种 复杂 的 图 案 花样 。Jacquard 曾经 把 一 张 用 他 自己 的 织 布 机 织 成 
的 挂 毯 送 给 了 Babbage， 完 成 挂 毯 的 编织 共 使 用 了 超过 10000 张 的 穿孔 卡片 。 对 于 Babbage 来 说 ， 看 到 一 
台 织 布 机 可 以 由 卡片 来 控制 ， 那 么 想到 也 可 以 用 卡片 来 控制 他 的 分 析 机 则 是 一 件 十 分 自然 的 事情 。Ada 
也 对 这 种 想法 感到 很 高 兴 ， 她 曾经 写 到 :“Babbage 的 分 析 机 可 以 求解 各 种 各 样 的 代数 方程 ， 就 如 同 jac- 
qard 的 织 布 机 可 以 编织 出 姿态 万 千 的 花卉 图 案 一 样 ”。 

后 来 的 事实 证 明了 穿孔 卡片 是 应 用 时 间 最 长 的 计算 机 输入 方法 。 直到 后 来 ， 构 建 计算 机 器 的 方法 
发 生 了 根本 性 的 变化 ， 才 出 现 了 键盘 输入 方式 。19 世纪 后 半期 ， 大 部 分 计算 机 器 都 是 采用 转 轮 式 机 制 
来 输入 数据 。 这 种 转 轮 式 机 制 很 难 与 早期 的 打字 键盘 整合 在 一 起 ， 其 原 央 是 老式 的 机 械 键盘 都 采用 村 
杆 式 结构 。 有 趣 的 是 ， 杠 杆 式 结构 的 设备 非常 适合 于 在 卡片 上 穿孔 ， 而 转 轮 式 的 设备 又 可 以 很 方便 地 
阅读 这 些 卡 片上 的 穿孔 。 当 时 ， 人 们 发 明了 各 种 各 样 的 设备 ， 用 来 对 穿孔 卡片 数据 进行 编码 ， 然 后 “ 制 
表 ” (tabulate) 。19 世纪 后 期 最 重要 的 穿孔 卡片 制 表 机 是 由 美国 人 霍 尔 瑞 斯 (Herman Hollerith，1860 - 
1929) 发 明 的 。 霍 尔 瑞 斯 的 制 表 机 曾 用 来 对 1880 年 美国 的 人 口 普查 数据 进行 编码 和 编辑 处 理 。 这 次 人 口 
普查 的 完成 时 间 创 下 记录 ， 为 截 尔 瑞 斯 带 来 高 额 利 润 ， 他 的 发 明 也 内 此 名 声 大 振 。 和 替 尔 瑞 斯 后 来 创建 了 
一 家 公司 ， 这 就 是 著名 的 IBM 公司 的 前 身 。 他 发 明 的 80 行 穿孔 卡片 ， 即 霍 尔 瑞 斯 卡片 ， 作 为 当时 的 自 
动 数据 处 理 的 主要 产品 流行 了 50 多 年 。 


1.5.2 第 一 代 : 真空 管 计 算 机 


尽管 Babbage 常常 被 称 为 “计算 之 父 ”， 但 他 所 设计 的 计算 机 器 是 机 械 式 的 ， 而 不 是 电动 的 或 者 电 
子 的 。 在 20 世纪 30 年 代 ， 德 国人 Konrad Zuse (1910 一 1995) 重新 拾 起 Babbage 的 机 器 ， 并 在 Babba- 
ge 的 设计 中 加 入 了 电学 技术 和 其 他 一 些 改 进 ， 制 造 出 一 台电 动 计算 机 。Zuse 的 计算 机 称 为 Z1， 采用 
电机 械 式 继电器 ， 而 不 是 Babbage 机 器 中 的 手动 曲柄 齿轮 。Z1 是 可 编程 的 ， 并 且 配 有 一 个 存储 器 ， 一 
个 算术 部 件 和 一 个 控制 部 件 。 当 时 德国 正 处 在 战争 时 期 ， 资 金 和 资源 都 十 分 匮乏 。Zuse 只 能 用 废弃 的 电 
影 胶片 来 替代 穿孔 卡片 作为 Z1 的 输入 方式 。Zuse 的 机 器 设计 采用 的 是 真空 管 ， 但 是 Zuse 在 独自 建造 这 
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些 机 器 时 ， 却 买 不 起 真空 管 。 因 此 ， 尽 管 Z1 中 没有 使 用 真空 管 ， 但 它 确实 属于 第 一 代 电 子 计 算 机 。 

Zuse 是 在 柏林 他 父母 的 起 居室 里 建造 了 2Z1 系统 ， 而 此 时 ,德国 正在 与 欧洲 的 大 部 分 国家 开战 。 
值得 庆幸 的 是 ，Zuse 没 能 说 服 纳粹 政府 购买 他 的 机 器 ， 因 为 纳粹 当局 还 并 没有 意识 到 这 种 计算 设备 有 
可 能 给 他 们 带 来 战术 上 的 优势 。 盟 军 的 邦 炸 摧 筑 了 Zuse 计算 机 器 的 首 批 全 部 三 台 系 统 : Z1、Z2 和 2Z3 
Zuse 的 机 器 的 确 令 人 印象 深刻 。 但 是 ， 一 直到 战争 结束 ，Zuse 都 没有 机 会 重建 或 进一步 改进 他 的 计算 
机 。 战 后 ，Zuse 的 设计 却 由 于 走 进 了 计算 机 历史 上 的 “ 男 一 个 进化 过 程 中 的 死胡同 ”而 终止 了 。 

今天 人 们 所 熟知 的 数字 计算 机 ， 是 许多 科学 家 在 20 世纪 30 年 代 到 40 年 代 时 期 的 工作 成 果 。 这 期 
间 ， 不 少 人 设计 了 基于 Pasical 基本 原理 的 机 械 式 计算 器 ， 并 对 模型 进行 了 大 量 修改 。 与 此 同时 ， 科 学 
家 们 在 现代 电子 计算 机 的 研究 方面 也 做 了 大 量 械 作 。 人 们 对 于 谁 才 是 现代 计算 机 的 第 一 人 ， 一 直 存 在 
着 各 种 争议 。 但 是 ， 在 现代 计算 机 的 发 明 者 中 ， 有 三 个 人 的 地 位 是 不 容 置疑 的 。 他 们 是 :John Atana- 
soff、John Mauchly 和 Presper Eckert。 

John Atanasoff 〈1904 一 1995) 建造 了 第 一 台 完 整 的 电子 计算 机 系统 ， 并 得 到 了 大 家 的 公认 。Ata- 
nasoff Berry 计算 机 简称 ABC) 是 一 台 用 真空 管 建造 的 二 进 制 机 器 。 由 于 这 台 机 器 是 为 了 求解 线性 
方程 系统 而 专门 建造 的 ， 所 以 它 不 能 称 为 通用 计算 机 。 然 而 ，ABC 计算 机 的 某 些 特性 与 几 年 后 建造 的 
通用 计算 机 ENIAC (又 称 为 电子 数字 积分 器 和 计算 机 ，Electronic Numerical Integrator and Computer) 
是 相同 的 。 由 于 这 两 种 机 器 所 具有 的 这 些 共 同 特性 ， 在 对 于 电子 数字 计算 机 的 发 明 权 和 专利 权 应 该 授 
予 谁 的 问题 上 ， 曾 经 引起 极 大 的 争论 。 对 于 这 种 争议 ， 有 兴趣 的 读者 可 以 阅读 Mollenhoff [1988] 的 
著作 ， 其 中 详细 描述 了 一 桩 有 关 Atanasoff 和 ABC 计算 机 的 马拉松 式 的 长 期 法 律 诉讼 。 

John Mauchly (1907 一 1980) 和 J. Presper Eckert (1929 一 1995) 是 在 1946 年 公布 于 众 的 ENIAC 
计算 机 的 两 位 主要 发 明 人 。ENAIC 被 公认 为 世界 上 第 一 台 全 电子 通用 数字 计算 机 。 这 人 台 机 器 共 使 用 了 
17 468 个 真空 管 ， 占 地 面积 1 800 平方 英尺 ， 重 30 吨 ， 耗 电 达 174 千瓦 。ENIAC 有 一 个 存储 容量 为 
1000 售 息 比特 《可 存储 大 约 20 个 10 位 的 十 进 制 数字 ) 的 存储 器 ， 并 且 采 用 穿孔 卡片 来 存储 数据 。 

Johp Mauchly 毕生 都 对 利用 数学 方法 来 预测 天 气 有 极 大 的 兴趣 ， 这 种 兴趣 导 玫 他 产生 了 根 建 造 电 
子 计算 机 器 的 合 头 ， 消 人 在 费城 (Philadeiphia) 附近 的 Ursinus 学 院 担任 物理 学 教授 时 . Mauchly 就 使 
用 几 十 台 机 械 式 的 加 法 机 器 并 雇佣 学 生 操 作 员 来 处 理 成 堆 的 数据 ,他 一 直 相 信和 这 些 数据 可 以 揭示 各 种 
' 天 气 类 型 彰 后 所 隐藏 的 数学 关系 。 他 当时 觉得 如 果 可 以 肯 增 加 一 些 计算 能 力 的 话 ， 就 可 以 实现 他 的 目 
桥 。 表面 者 来 ， 这 一 目标 似乎 就 在 他 现在 所 掌握 的 那些 东西 的 后 面 。 本 着 结合 进行 研究 工作 和 学 习 电 
子 计算 的 目的 ，Mauchly 自愿 到 宾 西 法 尼 亚 大 学 的 Moore 学 院 承 教 _ 门 电气 工程 方面 的 课程 。 在 完成 
这 个 教学 任务 后 ，Mauchly 接受 了 Moore 学 院 的 一 个 教学 职位 。 在 这 里 ， 他 教授 了 一 位 非常 有 才华 的 
学 生 ，J. Presper Eckert。Mauchly 和 Eckert 发 现 他 们 在 建造 电子 计算 机 方面 有 着 共同 的 兴趣 。 为 了 确 
保 建 造 他 们 设计 的 计算 机 所 需 的 资金 支持 ， 他 们 书写 了 一 份 正式 的 建议 书 送 到 学 校 去 参加 评审 。 在 建 
议 书 中 ， 他 们 对 所 设计 的 机 器 做 了 非常 保守 的 描述 ， 把 它 说 成 是 一 台 “ 自 动 计算 器 ”"。 当 时 ， 他 们 或 许 
已 经 知道 采用 二 进 制 的 计数 系统 可 以 使 计算 机 能 够 最 有 效 地 工作 。 但 是 ， 为 了 与 其 他 止 在 建造 中 的 大 
型 电子 加 法 器 保持 形式 上 的 一 致 ，Mauchly 和 Eckert 最 终 还 是 把 他 们 的 机 器 设计 成 为 一 个 使 用 以 10 为 
基数 的 数字 体系 。 宾 西法 尼 亚 大 学 最 后 拒绝 了 Mauchly 和 Eckert 的 建议 书 。 非 常 幸运 的 是 、 美 国 的 军 
方 却 对 他 们 的 计划 更 感 兴趣 。 

在 第 二 次 址 界 大 战 期 间 ， 美 国 的 军队 非常 迫切 地 需要 对 他 们 设计 的 新 型 火炮 的 弹道 进行 计算 。 当 
时 ， 军 方 雇佣 成 百 上 千 的 人 力 “ 计 算 机 "。 许 多 人 都 在 使 用 由 时 钟 转 杆 组 成 的 机 械 式 的 计算 机 器 ， 对 火 
炮 的 射击 表 进 行 各 种 各 样 算 术 计 算 。 当 得 知 电子 计算 机 可 以 将 弹道 表 的 计算 时 间 从 几 天 缩短 为 几 分 钟 
时 ， 军 方 决定 资 助 ENIAC 计划 。 上 ，ENIAC 的 确 把 计算 一 个 弹道 表 的 时 间 从 20 小 时 缩短 为 30 
秒 钟 。 但 不 幸 的 是 ， 直 到 战争 结束 ， 这 台 机 器 都 未 能 建成 。 然 而 ，ENIAC 已 经 证 明了 真空 答 计 算 机 的 
运行 速度 很 快 ， 并 且 切 实 可 行 。 在 流下 灯 的 10 多 年 中 ， 人 们 对 真空 管 的 计算 机 系统 不 断 改进 完善 ， 并 
且 在 商业 上 取得 了 成 功 。 
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: 夭 活 清 息 来 鸭 错 综 复 杂 、 

管 (vacuum tube) 的 简单 的 电子 器 件 的 发 明 。 

时 被 称 之 为 阀门 是 非常 合理 的 ， 因 为 真空 管 可 以 控制 电子 系统 中 电子 流动 ， 

置 中 的 阀门 控制 水 流 。 事 实 上 ，20 世纪 中 叶 的 许多 电子 管 产品 根本 就 不 是 真空 产品 。 为 了 满足 电学 特 

性 的 需要 ， 人 们 通常 在 这 些 电子 器 件 里 面 充满 了 一 些 导电 的 气体 〈 例 如 冬 蒸 汽 ) 。 


导线 纵横 交错 的 电子 计算 机 系统 ， 最 初 起 源 于 一 个 被 美国 人 称 为 真空 
更 确切 地 说 ， 英 国人 称 其 为 阀门 (valve)。 真 空 管 在 当 
其 工作 方式 类 似 于 水 管 装 


本 双 
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与 电子 管 工作 原理 有 关 的 电学 现象 是 在 1883 年 由 美国 的 发 明 家 爱迪生 〈Thomas A. Edison) 发现 
的 。 当 时 ， 爱 迪生 正在 试图 寻找 某 种 方法 ， 解 决 他 发 明 的 电灯 泡 所 遇 到 
的 一 个 难题 ， 即 灯泡 的 灯丝 在 通电 几 分 钟 后 就 会 被 烧 断 (或 者 说 被 氧 
化 )。 爱 迪生 成 功 找到 了 二 种 避免 灯丝 氧化 的 方法 ， 这 就 是 把 灯丝 放 入 真 
空中 。 当 时 ， 爱 迪生 并 没有 马上 意识 到 空气 不 但 可 以 助燃 ,而 且 是 一 种 
很 好 的 绝缘 材料 。 当 他 给 一 个 新 装 的 用 钨 材料 制 成 的 灯丝 电极 通电 时 ， 
灯丝 很 快 就 开始 发 热 ， 并 和 以 往 其 他 的 灯丝 一 样 被 烧 断 。 然 而 这 一 次 ， 
爱迪生 注意 到 灯泡 中 的 电流 还 在 继续 地 从 加 热 的 负极 向 没有 加 热 的 正极 
流动 。19118F5 英国 物理 学 家 理 查 森 (Owen Willans Riehardson) 对 这 
种 现象 进行 了 分 析 ， 并 得 出 了 结论 ; 当 一 一 个 带 负电 的 电灯 丝 被 加 热 时 ， 
电子 就 会 像 水 分 子 沸腾 一 样 ， 产 生 电子 蒸汽 。 他 把 这 种 现象 恰当 地 命名 
为 热电 子 发 射 (thermionic emission) 。 

对 于 爱迪生 发 现 的 热电 子 发 射 现象 ， 许 多 人 都 认为 这 只 不 过 是 一 个 电学 上 的 奇怪 现象 而 已 。 然 
而 ,爱迪生 的 前 助手 ,英国 科学 家 佛 莱 明 (John A. Fleming) 却 类 爱迪生 的 发 现 中 看 到 了 更 多 的 东 
西 。 他 注意 到 这 种 热电 子 发 射 产 生 的 电子 流 是 单方 向 的 ， 也 就 是 说 电子 是 从 带 负 电 的 阴极 (cathode) 
流向 带 正 电 的 阳极 Xanoede， 或 者 blate) 。 他 立即 意识 到 可 以 利用 这 种 特性 对 交流 电 进 行 整流 recti- 
fy) ， 即 将 交流 电 转 变 成 直流 电 。 在 当时 ， 直 流 电 对 于 电报 设备 的 工作 是 必 不 可 少 的 。 于 是 ， 佛 莱 明 
将 他 的 想法 付 诸 实践 ， 发 明了 一 种 后 来 称 为 二 极 管 〈diode) ， 或 者 称 为 整流 器 〈rectifier) 的 电子 阀门 
器 件 。 








这 种 二 ii tp ep 然而 ， 这 并 不 是 电子 真空 管 的 最 大 功能 。 
1907 年 ， 美 国人 Lee DeForest 在 这 种 二 极 管 中 加 入 了 一 个 被 称 为 控制 栅 〈control grip) 第 三 极 。 如 果 
控制 栅 带 有 负电 时 ， 可 以 减少 和 阻止 电子 从 二 极 管 的 阴极 流向 阳极 。 


当 阴 极 和 控制 栅 当 阴极 带 负 电 ， 
带 有 负电 ， 而 阳 而 阳极 和 控制 
极 带 正 电 时 ， 电 栅 带 有 正 电 时 ， 
子 会 滞留 在 阴极 电子 会 从 阴极 
附近 。 流向 阳极 。 





管 (triode)。 三 极 真 空 管 的 原理 图 如 右 所 示 。 

这 种 三 极 真 空 管 既 可 以 用 作 一 个 开关 ， 又 可 以 用 作 一 个 放大 器 。 在 控制 栅 上 
电荷 的 一 个 微小 的 变化 ， 就 会 引起 阴极 和 阳极 之 间 电 流 的 一 个 非常 大 的 变化 。 因 
此 ， 只 要 在 控制 机 上 施加 一 个 微弱 的 电信 号 ， 就 可 以 在 阳极 上 产生 一 个 很 强 的 信 
号 输出 。 如 果 在 控制 机 上 施加 足够 多 的 负电 荷 ， 就 能 够 阻止 所 有 的 电子 离开 
阴极 。 

后 来 ， 人 们 又 在 三 极 真空 管 中 再 次 加 入 了 另外 一 个 控制 栅 ， 这 样 可 以 对 电子 流 实现 更 精确 的 控制 。 
这 种 有 两 个 栅 极 的 真空 管 称 为 四 极 真空 管 〈 因 为 管内 共有 四 个 电极 ，tetrode)， 而 有 三 个 栅 极 的 真空 管 
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就 叫做 五 极 真空管 〈pentode)。 三 极 真 空 管 和 五 极 真空 管 在 通信 和 计算 机 中 的 应 用 最 为 普遍 。 通 常 ， 
人 们 还 将 两 三 个 三 极 真空 管 、 或 五 极 真 空 管 组 合 起 来 封装 在 一 个 
臻 璃 真空 管内 ， 这 样 它们 可 以 共用 一 个 加 热 器 ， 也 就 可 以 减 小 器 
件 的 功 耗 。 这 些 后 代 类 型 的 真空 管 被 称 为 微型 管 (miniature)， 因 
为 它们 的 尺寸 只 有 大 约 2 英寸 (5 厘米 ) 高 ， 直 径 约 为 半 英 十 
(1.5 厘米 ) 。 而 类 似 的 全 尺寸 二 极 真 空 管 、 三 极 真 空 管 和 五 极 真 
空 管 仅仅 比 家 用 电灯 泡 稍微 小 一 点 。 

后 来 ， 真 空 管 变 得 越 来 越 不 适合 用 来 制造 计算 机 系统 。 即 使 
最 简单 的 真空 管 计算 机 也 需要 安装 数 千 个 真空 管 。 加 热 这 些 真空 
管 的 阴极 需要 消耗 巨大 的 电能 。 为 了 避免 热 熔化 现象 ， 真 空 管 中 
的 热量 必须 要 尽快 从 系统 中 散 去 。 如 果 我 们 让 阴极 的 加 热 器 以 较 
低 的 电压 工作 ， 显 然 可 以 减 小 真空 管 的 功 耗 和 热 耗 散 现象 。 但 是 四 极 管 二 杠 管 
这 样 一 来 ， 也 会 降低 本 来 就 比较 慢 的 真空 管 的 开关 速度 。 尽 管 存在 功 耗 和 其 他 种 种 限制 ， 但 无 论 是 模 
拟 真 空 管 计算 机 ， 还 是 数字 真空 管 计算 机 ， 都 为 人 们 服务 了 许多 年 ， 并 且 它 们 是 各 种 现代 的 计算 机 系 
统 的 体系 结构 基础 。 

现在 ， 距 离 最 后 一 台 真 空 管 计算 机 已 经 过 去 了 几 十 年 ， 但 是 人 们 仍然 还 在 音频 放大 器 中 使 用 真空 
管 。 这 些 所 谓 “高 端 ”放大 器 特别 受到 音乐 家 们 的 青睐 ， 因 为 他 们 相信 和 真空管 所 提供 的 带 有 回旋 共 据 
的 美妙 声音 是 使 用 固体 器 件 的 音响 设备 所 无 法 获得 的 。 加 


1.5.3 第 二 代 : 晶体 管 计算 机 


事实 上 ， 第 一 代 真 空 管 技 术 的 计算 机 并 不 是 非常 可 靠 。 曾 经 有 一 些 ENIAC 的 批评 者 认为 这 种 系 
统 永 远 不 可 能 正常 运行 ， 理 由 是 这 些 真 空 管 被 烧 坏 的 速度 实在 是 太 快 了 ， 以 至 于 人 们 来 不 及 替换 它们 。 
虽然 ENIAC 系统 的 可 靠 性 并 不 像 批 评 者 所 预期 的 那样 糟 ,但 是 真空 管 计算 机 系统 的 通常 停机 维修 时 
间 的 确 要 比 它们 正常 运行 的 时 间 还 要 长 。 

1948 年 ， 贝 尔 实验 室 的 三 位 研究 员 巴 丁 (John Bardeen)、 布 拉 顿 (Walter Brattain) 积 肖 克利 
(William Shockley) 发 明了 晶体 管 。 这 种 新 型 的 技术 不 但 掀起 了 电子 器 件 、 电 视 和 无 线 电 广播 等 领域 
的 革命 ， 而 且 推动 着 计算 机 的 发 展 进 人 了 一 个 新 的 时 代 〈1954 一 1965) 。 与 真空 管 相 比 ， 唱 体 管 体 积 更 
小 ， 功 耗 更 低 ， 而 且 工 作 性 能 更 加 可 靠 。 这 样 一 来 ， 品 体 管 计算 机 中 的 电子 线路 也 随 之 变 得 更 加 小 型 
化 并 具有 更 高 的 可 靠 性 。 尽 管 使 用 了 晶体 管 ， 这 一 代 的 计算 机 系统 的 体积 还 是 过 于 庞大 有 旦 价格 也 相当 
昂贵 。 通 常 只 有 一 些 大 学 、 政 府 机 关 和 大 型 商业 机 构 才 买 得 起 这 种 计算 机 。 值得 一 提 的 是 ， 这 期 间 涌 
现 了 大 量 的 计算 机 制造 商 。 其 中 ，IBM 公司 、 数 字 仪 器 公司 (DEC) 和 Univac (现在 称 作 Unisys) 等 
公司 主导 了 当时 的 计算 机 产业 。 据 统计 ，IBM 公司 在 这 期 间 成 功 销售 了 7094 台 作 为 科学 应 用 和 1401 
台 作 为 商业 应 用 的 晶体 管 计算 机 。DEC 公司 在 当时 则 忙于 建造 PDP-1 型 的 计算 机 系统 。 一 个 由 
Mauchly 和 Eckert 创建 的 公司 〈 不 久 便 被 卖 掉 ) 主要 制造 Univac 品牌 的 计算 机 系统 。 在 这 一 代 计 算 机 
中 ， 最 成 功 的 Unisys 系统 当 属 它 的 1100 系列 产品 。 另 外 还 有 一 家 公司 ， 控 制 数据 公司 (CDC)， 则 在 
Seymour Cray 的 领导 下 ， 建 造 了 世界 上 第 一 台 超 级 计算 机 CDC6600。 这 人 台 价 格 为 1000 万 美元 的 
CDC6600 超级 计算 机 每 秒 钟 可 以 执行 1000 万 条 指令 ,采用 60 位 〈bit) 字 长 ， 并且 拥有 在 当时 令 人 吃 
惊 的 128K 字 节 的 主 存储 器 。 








晶体 管 〈transistor) 为 英文 单词 转移 电阻 (transfer resistor) 的 缩写 。 事 实 上 ， 草 体 管 是 一 种 利 
用 固体 器 件 制 造 的 真空 三 极 管 。 但 是 ， 现 实 中 却 没有 固体 器 件 形式 的 真空 四 极 管 或 真空 五 极 管 。 由 于 
电子 在 固体 介质 中 的 运动 比 在 真空 管 的 开放 空间 中 更 容易 控制 ， 所 以 在 固体 电子 器 件 中 不 肯 需 要 额外 
的 控制 电 级 。 化 学 元 素 锚 和 硅 都 能 够 用 作 固体 电子 器 件 中 的 基本 “固体 ”介质 。 纯 净 状 态 的 钳 和 硅 都 
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是 电学 上 的 不 良 导体 。 但 是 ， 如 果 它 们 与 元 素 周期 表 中 的 某 些 邻 近 元 素 结合 ， 就 可 以 变 成 良 导体 。 而 
且 ， 我 们 可 以 非常 方便 地 控制 它们 的 导电 性 能 。 

硼 、 铝 和 狼 在 元 素 周期 表 中 位 于 硅 和 钞 的 左边 。 这 些 元 素 的 外 层 电子 壳 层 
(或 称 为 价 带 ，valence) 的 电子 数 要 比 硅 和 钳 元 素 的 外 层 电子 数 少 一 个 。 如 果 
我 们 将 少量 的 铝 元 素 添加 到 硅 材料 中 ， 就 会 造成 硅 的 外 层 电 子 壳 层 的 某 些 不 平 
衡 。 这 时 ， 铝 原子 会 从 周围 的 硅 原子 上 吸引 一 个 电子 ， 形 成 有 一 个 带 有 过 剩 电 
子 的 负电 荷 中 心 。 利 用 这 种 方式 对 材料 进行 调剂 〈 我 们 称 之 为 返 杂 ，doped)， 
硅 或 钳 材 料 就 变 成 了 所 谓 了 型 (P-type) 半导体 材料 。 

类 似 地 ， 如 果 在 硅 材料 中 加 入 少量 的 砷 、 磷 或 饥 元 素 ， 硅 材料 晶体 的 价 带 
将 获得 额外 的 电子 ， 就 变 成 N 型 (Nr-type) 材料 。 在 N 型 半导体 中 ， 这 些 束 
缚 较 弱 的 额外 电子 可 以 自由 移动 ， 形 成 小 量 电流 。 换 名 话说， 如 果 在 N 型 材 
料 上 施加 一 个 正 电 压 ， 电 子 将 会 从 负极 流向 正极 。 如 果 施 加 反 向 外 加 电压 ， 即 给 N 型 半导体 加 负电 
压 ， 而 了 P 型 半导体 加 正 电 压 ， 材 料 中 就 不 会 有 电流 产生 。 这 就 是 说 ， 我 们 可 以 利用 一 个 简单 的 N 型 和 
P 型 半导体 结 制造 一 个 固体 二 极 管 。 








固体 三 极 管 〈 即 晶体 管 ) 由 三 层 半 导体 材料 组 成 。 我 们 将 一 片 P 型 材料 夹 在 两 层 N 型 材料 之 中 ， 
或 者 是 将 一 片 N 型 材料 夹 在 两 层 P 型 材料 之 中 ， 组 成 所 谓 的 三 明治 结构 。 前 者 称 为 NPN 型 晶体 管 ， 
后 者 称 为 PNP 型 晶体 管 。 晶 体 管 结构 的 中 间 层 称 为 基 极 ， 而 其 他 两 层 分 别称 为 发 射 极 和 集 电极 。 

下 图 说 明 NPN 和 PNP 型 晶体 管 中 的 电流 方向 。 品 体 管 中 基 极 的 作用 就 好 像 是 真空 三 极 管 中 的 控 
制 棉 极 : 晶体 管 基 极 中 一 个 小 的 电流 变化 ， 能 够 引起 发 射 极 和 集 电极 之 间 的 一 个 大 的 电流 。 







少数 电子 抽出 和 


大 电流 输出 


+ 


采用 “TO-50” 形 式 封 装 的 分 立 元 件 (discrete-component) 的 晶体 管 如 第 1 个 图 所 示 。 利 用 三 根 
分 别 连接 基 极 、 集 电极 和 发 射 极 的 引线 〈lead) ， 可 以 将 晶体 管 和 外 电路 连接 在 一 起 。 晶 体 管 不 但 比 真 
空 管 体 积 小 ， 而 且 工 作 温度 低 ， 性 能 也 可 靠 得 多 。 真 空 管 中 的 灯丝 ， 就 像 电灯 泡 中 的 灯丝 一 样 ， 烧 起 
来 发 汤 ， 最 后 很 容易 被 烧 断 。 采 用 晶体 管 元 件 的 计算 机 自然 要 比 前 一 代 的 真空 管 计算 机 体积 要 小 得 多 ， 
工作 温度 也 要 低 得 多 。 但 最 终 的 微型 化 并 不 是 通过 使 用 分 立 的 晶体 管 来 蔡 代 分 立 的 真空 管 实现 的 ， 而 
是 将 整个 电路 压缩 到 一 块 硅 片 上 。 

集成 电路 (或 称 为 芯片 ，chip》 中 集成 了 几 百 到 几 百 万 个 微型 晶体 管 。 人 们 可 以 采用 几 种 不 同 的 
技术 来 制造 集成 电路 。 其 中 一 种 创建 集成 电路 的 最 简单 的 方法 是 利用 计算 机 辅助 设计 软件 ， 将 组 成 芯 
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片 的 各 个 不 同 硅 材料 层 的 每 一 层 都 印 制 成 放大 的 结构 图 ， 就 像 照 相 用 的 底片 。 然 后 
制版 的 技术 ， 利 用 这 些 计算 机 设计 出 来 的 不 同 层 的 结构 
图 在 硅 片 上 生成 各 种 不 同 的 电路 。 利 用 紫外 光 透 过 结构 
图 底片 照射 硅 片 ， 引 起 涂 甫 在 硅 片 表面 上 的 一 层 光 阻 材 
料 〈 称 为 光敏 感 材料 ) 的 化 学 性 质 发 生变 化 。 然后， 将 
芯片 浸入 某 种 化 学 液体 中 。 硅 片上 被 曝光 的 区 域 将 会 被 
冲洗 掉 ， 结 果 腐 蚀 后 就 留 下 各 种 电路 的 精细 图 案 。 这 种 
技术 称 为 光 刻 照相 制版 《photomicrolithography) 。 腐 蚀 过 程 完成 后 ， 在 芯片 衬 底 材 料 的 表面 淀 积 一 层 
N 型 或 者 P 型 材料 。 然 后 ， 再 将 这 一 层 材 料 表面 也 涂 上 光 阻 材料 ， 类 似 于 前 面 一 层 的 处 理 ， 进 行 曝光 
和 腐蚀 处 理 。 重 复 类 似 的 过 程 ， 直 到 所 有 电路 层 的 腐蚀 过 程 都 完成 ， 形 成 如 上 图 所 示 的 N 型 和 了 型 材 
料 的 不 同 峰 谷 的 结构 。 这 些微 型 的 电子 元 器 件 ， 包 括 唱 体 管 ， 不 但 工作 性 能 与 较 大 尺寸 的 分 立 元 器 件 
完全 相同 ， 而 且 工 作 速 度 更 快 ， 功 耗 很 小 。 嘱 


1.5.4 第 三 代 : 集成 电路 计算 机 


随 着 集成 电路 的 诞生 ， 计 算 机 真正 进入 了 爆炸 式 的 快速 发 展 时 期 (1965 一 1980) 。Jack Kilby 发 明 
了 集成 电路 (IC)， 我 们 称 之 为 微 芯片 (microchip)， 这 种 集成 电路 是 利用 错 材 料 制 成 的 。6 个 月 后 ， 
一 直 从 事 集成 电路 设计 工作 的 Robert Noyce 采用 硅 材 
料 ， 而 不 是 销 材 料 ， 制 造 了 类 似 的 集成 电路 器 件 。 这 种 
硅 芯 片 葛 定 计算 机 工业 的 基础 。 早 期 的 集成 电路 ， 只 是 
在 单 块 硅 芯 片上 集成 了 几 十 个 晶体 管 。 但 是 ， 这 些 集 成 
电路 的 尺寸 已 经 比 “ 分 立 元 件 ” 的 晶体 管 还 要 小 。 使 用 
集成 电路 的 计算 机 ， 速 度 更 快 、 体 积 更 小 且 价 格 也 更 加 
便宜 。 并 且 ， 集 成 电路 的 计算 机 在 处 理 能 力 方面 有 了 巨 
大 提高 。IBM 公司 生产 的 System/360 系列 计算 机 ， 就 
属于 第 一 批 完全 采用 固体 元 器 件 建造 的 商用 计算 机 。360 
系列 计算 机 也 是 IBM 公司 所 提供 的 第 一 代 可 以 相互 兼容 
的 系列 产品 ， 也 就 是 说 这 个 系列 的 计算 机 都 使 用 相同 的 
汇编 语言 。 这 样 ， 一 些小 型 计算 机 的 用 户 可 以 很 方便 地 
升级 到 较 大 型 的 机 器 ， 而 无 需 重 新 编写 原来 所 有 的 机 器 


， 采 用 类 似 于 照相 








和 8 计算 机 元 件 大 小 的 比较 
软件 。 这 在 当时 来 说 是 一 种 具有 革命 性 的 新 思想 。 从 图 的 货 部 开始 、 按 顺 时 针 方 向 分 别 为 : 
在 IC 时 代 ， 还 引进 了 分 时 共享 (time-sharing) 和 多 站 二 和 
) 晶体 管 


道 程序 处 理 (mnultiprogramming， 即 具有 多 个 人 同时 使 用 
一 台 计 算 机 的 能 力 ) 的 概念 。 反 之 ， 多 道 程序 处 理 又 需 
要 为 这 些 计 算 机 引进 新 的 操作 系统 。 具 有 分 时 共享 能 力 
的 小 型 计算 机 系统 的 出 现 ， 例 如 DEC's、PDP-8 和 PDP- 


3) 包含 有 3200 个 2- 输入 与 非 门 (NAND) 的 芯片 
4) 集成 电路 封装 左手 角 下 方 的 银色 方块 就 是 一 块 
集成 电路 ) 


感谢 Linda Null 提供 的 照片 


11， 使 得 一 些小 公司 和 许多 大 学 都 负担 得 起 利用 计算 机 来 进行 计算 工作 。IC 技术 的 发 展 同样 也 促进 了 一 
些 功能 更 加 强大 的 超级 计算 机 的 开发 。Seymour Cray 借助 于 在 建造 CDC-6600 系统 时 所 学 到 的 知识 ， 开 
办 了 自己 的 计算 机 公司 : Cray Research Corporation。 这 家 公司 从 1976 年 推出 价值 880 万 美元 的 Cray-1 开 
始 ， 建 造 了 许多 超级 计算 机 。Cray-1 在 性 能 上 已 经 远 远 超过 了 CDC-6600， 它 可 以 在 一 秒 钟 内 执行 超过 


1.6 亿 条 指令 ， 并 支持 8 兆 字 节 的 存储 器 。 
1.5.5 第 四 代 : 超大 规模 集成 电路 计算 机 


在 电子 技术 变革 的 第 三 代 ， 已 经 出 现 了 多 个 晶体 管 集成 到 一 块 世 片上 的 集成 电路 。 随 着 半导体 制 
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造 技术 和 心 片 技术 的 不 断 发 展 ， 单 块 芯片 上 可 以 集成 的 晶体 管 数目 越 来 越 多 。 集 成 电路 技术 的 发 展 分 
为 以 下 几 个 阶段 : 小 规模 集成 电路 〈SSI): 每 块 芯 片上 只 有 10 一 100 个 元 件 ， 中 规模 集成 电路 
(MSD : 每 块 芯片 上 集成 100 一 1000 个 元 件 ; 大 规模 集成 电路 (LSI) : 每 块 芯 片上 集成 的 元 件 多 达 
1000 一 10000 个 ; 最 后 是 超大 规模 集成 电路 (VLSI) ， 每 块 芯片 上 集成 的 元 件 超过 10000。 超 大 规模 集 
成 电路 标志 着 第 四 代 计 算 机 的 开始 。 

为 了 使 大 家 对 集成 度 有 一 个 基本 的 概念 ， 现 在 我 们 来 考虑 一 个 计划 : 就 是 要 把 ENIAC 组 装 到 一 
个 必 片 上 。1997 年 ， 为 了 纪念 第 一 台电 子 计 算 机 诞生 50 周年 ， 一 群 宾夕法尼亚 大 学 的 学 生 制 造 了 一 
个 单 世 片 的 “ENIAC”。 原 来 那个 占 地 1800 平方 英尺 ， 重 30 吨 且 耗 电 170 千瓦 的 庞然大物 被 微缩 到 只 
有 拇指 指甲 大 小 的 一 块 芯片 。 这 块 芯片 包含 约 174 569 只 晶体 管 ， 这 个 数目 还 不 到 20 世纪 90 年 代 后 期 
相同 大 小 的 硅 片 上 通常 所 集成 的 元 件数 目的 十 分 之 一 。 

利用 VLSI，Intel 公司 在 1971 年 创造 出 了 世界 上 第 一 个 微 处 理 器 4004。 这 是 一 个 全 功能 的 4 位 系 
统 ， 工 作 频 率 为 108KHz。Intel 公司 还 引进 了 随机 存储 器 (RAM) 芯片 ， 单 芯片 上 可 以 存储 4K 位 的 存 
储 器 。 这 样 一 来 ， 第 四 代 计 算 机 和 以 前 的 固体 元 件 计算 机 相 比 ， 体 积 更 小 、 速 度 更 快 。 

VLSI 的 技术 和 它 那 难以 令 人 置信 的 缩小 电子 线路 的 能 力 ， 催 生 了 微型 计算 机 (简称 微机 〉 的 发 
展 。 微 型 计算 机 系统 的 体积 非常 小 ， 价 格 也 不 贵 ， 普 通 大 众 都 可 以 买 得 起 ， 用 得 起 。 最 早 的 微型 计算 
机 是 微型 仪器 和 遥感 技术 公司 (MITS) 1975 年 推出 的 Alstair 8800。 随 后 ， 很 快 涌现 出 了 Apple I、 
Apple I，Commodore 公司 的 PET 和 Vic 20 等 多 款 微 机 。 到 了 1981 年 ，IBM 公司 推出 了 个 人 计算 机 
(Personal Computer，PC 机 )。 

个 人 计算 机 是 IBM 公司 生产 的 一 种 “人 入门 级 ”计算 机 系统 的 第 三 次 尝试 。 公 司 早期 推出 的 Data- 
master 以 及 5100 系列 的 上 府 上 型 计算 机 在 市 场 上 遭受 了 惨痛 失败 。 尽 管 遭 遇 到 这 些 早 期 的 失败 经 历 ， 但 
IBM 公司 的 John Opel 还 是 说 服 公司 的 管理 层 再 进行 一 些 这 方面 的 尝试 。 他 建议 在 远离 IBM 公司 总 部 
(Armonk，New York) 的 Florida 州 的 Boca Raton 成 立 一 个 相对 自治 的 “独立 事业 部 ”。Opel 挑选 了 
一 位 精力 充沛 又 非常 有 能 力 的 工程 师 Don Estridge 负责 代号 为 Acorn 的 新 系统 开发 。 鉴 于 IBM 公司 过 
去 在 小 型 系统 领域 的 失败 教训 ， 公 司 的 领导 层 对 Acorn 项 目的 进度 和 经 费 支出 进行 了 严格 的 控制 。 最 
后 ， 在 Opel 承诺 一 年 之 内 推出 产品 后 ， 这 个 项 目 才 得 以 开始 实施 。 看 起 来 ， 在 这 样 短 的 一 个 期 限 内 似 
乎 是 不 可 能 实现 的 。 

Estridge 知道 要 在 短 短 12 个 月 计划 中 推出 PC 机 ， 唯 一 的 出 路 就 是 要 打破 IBM 的 传统 惯例 ， 尽 可 
能 多 地 使 用 “ 非 定 制 的 ”的 通用 部 件 。 因 此 ， 从 这 种 思想 出 发 ，IBM 的 PC 机 构思 设计 成 为 一 种 “ 开 
放 式 ”的 体系 结构 。 尽 管 后 来 IBM 公司 的 某 些 人 后 悔 当 时 的 这 个 决定 使 得 PC 机 的 体系 结构 很 少 有 专 
利 产品 的 成 分 ， 但 正 是 因为 这 种 广泛 的 公开 性 让 IBM 公司 为 计算 机 工业 制定 了 行业 标准 。 就 在 IBM 
的 竞争 者 忙于 起 诉 抄袭 他 们 系统 设计 的 公司 时 ，PC 机 的 克隆 产品 已 经 如 雨后春笋 般 遍 地 滋生 于 来 了 。 
不 久 ,“IBM -兼容 ”微机 的 价格 下 降 到 每 个 小 公司 都 能 承受 的 水 平 。 同 样 ， 要 感谢 那些 克隆 产品 的 制造 
者 ， 央 为 他 们 大 量 生产 的 这 类 计算 机 系统 产品 很 快 就 在 人 们 的 家 中 找到 了 真正 的 “个 人 使 用 ”的 市 场 。 

IBM 公司 最 终 丢 失 了 它 在 微型 计算 机 市 场 的 主导 地 位 ， 但 是 “魔鬼 已 经 从 瓶子 中 跑 了 出 来 "。 无 论 
好 坏 ，IBM 的 体系 结构 事实 上 仍然 是 微型 计算 机 制造 业 的 行业 标准 ， 而 且 每 年 都 不 断 有 更 大 更 快 的 计算 
机 系统 面世 。 如 今 ， 普 通 的 桌面 计算 机 的 运算 能 力 已 经 超过 20 世纪 60 年 代 大 型 计算 机 系统 许多 倍 了 。 

自从 20 世纪 60 年 代 以 来 ， 由 于 VLSI 技术 的 突飞猛进 ， 大 型 计算 机 系统 在 性 价 比方 面 已 经 取得 了 
令 人 膛 目 结 舌 的 进步 。 尽 管 IBM System/360 在 当时 已 经 完全 是 一 个 固体 电子 器 件 的 系统 ， 但 是 它 仍 
然 是 一 个 需要 水 冷 的 和 非常 耗 电 的 庞然大物 。 它 每 秒 钟 仅 能 执行 50 000 条 指令 ， 且 只 能 支持 16 兆 字 
节 的 存储 器 。 通 常情 况 下 ， 这 些 系统 中 只 装 有 数 千 字 节 左右 的 物理 存储 器 。 大 型 计算 机 实在 是 太 贵 了 ， 
以 至 于 只 有 最 大 型 的 公司 和 大 学 才能 够 买 得 起 或 租 得 起 一 台 这 样 的 系统 。 当 今 的 大 型 计算 机 ， 又 称 为 
“企业 级 服务 器 ”， 其 价格 仍 提高 达 上 百 万 美元 。 但 是 ， 和 过 去 相 比 这 些 大 型 计算 机 的 处 理 能 力 已 经 提 
高 了 几 千 倍 以 上 。20 世纪 90 年 代 后 期 ， 大 型 计算 机 系统 的 性 能 指标 就 已 经 路 过 了 每 秒 钟 执行 10 亿 条 





绚 


中 


17 





指令 的 目标 。 这 些 大 型 计算 机 系统 通常 用 作 网 络 服 务 器 ， 在 日 常 工作 中 每 分 钟 都 要 完成 成 于 上 万 件 事 
务 的 处 理工 作 。 

VLSI 技术 带 给 超级 计算 机 的 强大 处 理 能 力 实在 是 难以 全 面 地 加 以 评述 。 第 一 台 超级 计算 机 
CDC6600， 每 秒 钟 可 以 执行 1000 万 条 指令 ， 并 配 有 128 K 字 节 主 存储 器 。 相 比 之 下 ， 今 天 的 超级 计算 
机 的 内 部 可 能 包含 几 和 于 个 处 理 器 ， 可 以 编 址 上 万 亿 字 节 (terabyte) 的 存储 器 ， 而 且 不 久 就 可 以 达到 每 
秘 钟 执行 千 万 亿 (quadrillion〉 条 指令 的 运算 速度 。 

到 底 会 是 什么 样 的 技术 标志 着 第 五 代 计算 机 的 开始 呢 ? 有 些 人 说 第 五 代 计算 机 的 标志 是 并 行 处 理 、 
网 络 应 用 和 单 用 户 工 作 站 的 广泛 普及 和 接受 。 很 多 人 相信 现在 实际 上 已 经 跨越 了 第 五 代 。 还 有 一 些 人 
把 第 五 代 计算 机 的 特征 定义 为 神经 网 络 、DNA、 或 者 是 光学 计算 机 系统 的 时 代 。 也 许 在 我 们 已 经 进步 
到 第 六 代 或 者 是 第 七 代 计算 机 之 前 ， 都 不 可 能 定义 出 什么 是 五 代 计 算 机 ， 当 然 也 无 法 预料 后 来 的 那些 
时 代 会 给 我 们 带 来 些 什 么 。 


1.5.6 摩尔 定律 


超大 规模 集成 电路 的 高 速 发 展 究竟 要 到 哪里 才 算是 结束 ?晶体管 到 底 可 以 做 到 多 小 ? 心 片上 堆积 的 
最 大 元 件 密度 可 以 有 多 高 ?对 于 这 些 问 题 谁 也 说 不 清楚 。 事 实 上 ， 科 学 家 们 每 年 都 在 不 断 突破 那些 预言 
者 试图 设置 的 所 谓 集成 度 的 极限 。 在 1965 年 ， 当 Intel 公司 的 奠基 人 摩尔 (Gordon Moore) 预言 “集成 电 
路 中 的 晶体 管 数目 将 会 每 年 翻 一 番 ” 时 ， 不 少 人 都 对 此 表示 怀疑 。 对 这 个 预言 ， 现 在 的 说 法 通常 被 解释 
为 “ 硅 世 片 的 密度 每 18 个 月 翻 一 番 ”"。 摩 尔 的 这 一 断言 已 经 变 成 了 著名 的 摩尔 定律 〈Moore's Law)。 摩 
尔 当 初 预测 他 的 这 个 假定 只 能 够 维持 10 年 左右 的 时 间 。 然 而 ， 蔚 片 制造 技术 的 进步 已 经 让 摩尔 定律 足 足 
保持 了 差不多 40 年 。 而 且 ， 还 有 很 多 人 甚至 认为 到 了 21 世纪 10 年 代 时 ,摩尔 定律 仍旧 会 保持 有 效 。 

然而 ， 采 用 当前 的 技术 ， 摩 尔 定 律 所 指出 的 集成 电路 的 这 种 发 展 趋势 不 可 能 永远 保持 下 去 。 很 显 
然 ， 各 种 物理 和 财务 上 的 限制 终究 会 出 现 。 以 当前 集成 电路 缩小 的 速率 计算 ， 大约 还 需要 500 年 就 可 
以 把 整个 太阳 系 集成 到 一 块 芯片 上 上 。 当 然 ， 集 成 电路 的 技术 发 展 还 存在 着 这 样 或 那样 的 许多 制约 因素 。 
费用 问题 也 许 就 是 一 个 最 终 的 限制 。Intel 公司 的 早期 投资 人 Arthur Rock 曾 提出 了 所 谓 的 Rock 定律 ， 
它 可 以 作为 摩尔 定律 的 一 个 推论 : 即 “ 制 造 半导体 集成 电路 所 需要 的 主要 设备 的 成 本 每 4 年 就 要 翻 一 
番 ”。Rock 定律 出 自 于 一 个 像 Rock 这 样 的 金融 家 的 观察 研究 。 他 发 现 新 的 芯片 生产 设备 的 价格 标签 从 
1968 年 的 大 约 12 000 美元 逐步 升 高 到 90 年 代 后 期 的 1 200 万 元 美元 。 按 照 现在 这 样 的 速率 发 展 下 去 ， 
到 2035 年 不 但 存储 器 单元 的 尺寸 会 小 于 一 个 原子 ， 而 且 制 造 一 个 芯片 就 需要 花费 掉 全 世界 的 整个 财 
富 。 这 样 ， 邯 使 我 们 可 以 把 芯片 做 得 越 来 越 小 ， 速 度 也 越 来 越 快 ， 但 是 最 终 的 问题 是 我 们 是 否 能 够 付 
得 起 建造 这 些 芯片 的 费用 。 

的 确 ， 如 果 摩 尔 定律 保持 正确 ， 那 么 Rock 定律 必须 失效 。 很 显然 ， 如 果 上 面 这 两 种 情况 都 发 生 的 
话 ， 计 算 机 制造 必须 采用 全 新 的 技术 。 有 关 新 的 计算 范式 的 研究 在 上 个 10 年 的 后 半期 就 已 经 着 手 开 始 
进行 了 。 在 有 机 计算 、 超 导 、 分 子 物理 和 量子 计算 等 领域 已 经 出 现 了 新 型 计算 机 的 实验 室 原型 。 量 子 
计算 机 采用 量子 力学 的 奇妙 思想 来 解决 计算 问题 ， 这 种 构思 特别 令 人 兴奋 。 与 以 前 所 使 用 的 任何 计算 
方法 相 比 ， 量 子 计算 方法 不 但 在 运算 速度 上 成 指数 增加 ， 而 且 对 计算 问题 的 定义 方式 也 有 革命 性 的 变 
革 。 那 些 在 我 们 今天 看 来 是 有 些 恩 于 而 不 切实 际 的 难题 ， 可 能 会 是 下 一 代 的 学 童 能 够 很 容易 掌握 的 问 
题 。 事 实 上 ， 也 许 那 时 的 学 童 看 到 我 们 的 “原型 ”计算 机 系统 会 觉得 很 好 笑 ， 就 像 我 们 现在 去 看 
ENIAC 机 器 一 样 。 


1.6 计算 机 的 分 层 组 织 结构 


如 果 需 要 计算 机 解决 各 式 各 样 的 问题 ， 那 么 计算 机 就 必须 能 够 执行 用 各 种 不 同 诸 言 编写 的 程序 ， 
从 FORTRAN 和 C 请 言 到 Lisp 和 Prolog 语言 。 正 如 读者 在 第 3 章 将 会 看 到 的 ， 打 开 计算 机 我 们 所 面 
对 的 物理 元 件 只 是 一 些 导 线 和 逻辑 门 。 在 这 些 物 理 元 件 和 高 级 语言 (如 C++ 语言 ) 之 间 存 在 着 一 个 巨 
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大 的 空间 (从 语义 学 上 来 讲 是 存在 一 个 间 陵 ，gap) 。 作 为 一 个 实际 应 用 的 计算 机 系统 ， 对 于 大 多 数 的 
用 户 来 说 ， 这 种 语义 学 上 的 间隙 必须 是 不 可 见 的 。 

有 编程 经 验 的 人 都 知道 ， 如 果 要 解决 一 个 很 大 的 问题 ， 我 们 应 该 把 这 个 大 问题 分 解 ， 采 用 “分 而 
治之 ”的 方法 。 在 编程 时 ， 通 常会 先 把 一 个 问题 分 成 若干 个 模块 ， 然 后 单独 设计 每 一 个 模块 。 每 个 模 
块 都 执行 一 个 特定 的 任务 。 在 应 用 这 些 模块 时 ， 我 们 需要 了 解 的 仅仅 是 这 些 模块 和 其 他 模块 之 间 的 相 
互 连 接 方式 。 

计算 机 系统 的 组 成 原理 与 此 类 似 。 通 过 抽象 原理 ， 我 们 可 以 设想 计算 机 是 按照 不 同 的 层次 结构 来 
建造 的 。 这 里 的 每 一 个 层次 都 有 某 项 特定 功能 ， 并 有 一 个 特定 的 假想 机 器 与 之 相对 应 。 对 应 计算 机 的 
每 一 个 层次 的 这 种 假想 的 计算 机 称 之 为 虚拟 机 (virtual machine)。 每 一 层 的 虚拟 机 都 执行 自己 特有 的 
指令 集 ， 必 要 时 还 可 以 调用 较 低层 次 的 虚拟 机 来 完成 各 种 工作 任务 。 通 过 学 习 计算 机 的 组 成 原理 ， 读 
者 将 会 了 解 到 这 种 层次 划分 的 合理 性 ， 各 个 层次 的 实现 方式 以 及 各 个 层次 之 间 的 相互 连接 方式 〈 或 称 
为 接口 ，interface) 。 图 1-3 给 出 了 现在 大 家 普遍 接受 的 代表 不 同 抽象 的 虚拟 机 器 的 计算 机 结构 层次 。 
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图 13 ”现代 计算 机 系统 组 成 的 不 同 抽象 层次 

第 6 层 是 用 户 层 (User Level)， 它 由 各 种 应 用 任务 组 成 ， 这 是 大 家 最 熟悉 的 层次 。 在 这 一 个 层次 ， 
主要 是 运行 各 种 程序 ， 比 如 说 文字 处 理 程序 、 图 形 程序 包 、 或 者 是 各 种 游戏 等 。 从 用 户 层 来 看 ， 较 低 
的 层次 基本 上 是 不 可 见 的 。 

第 5 层 是 高 级 语言 层 (High-Level Language Level)， 它 由 各 种 高 级 编程 语言 组 成 ， 例 如 C、 
C++ LEORTRAN Lisp、Pascal 和 Prolog 等 高 级 语言 。 我 们 必须 利用 某 种 编译 程序 或 者 解释 程序 将 
这 些 高 级 语言 翻译 成 机 器 可 以 理解 的 语言 。 然 后 ， 将 这 些 编译 后 的 高 级 语言 首先 翻译 成 汇编 语言 ， 再 
将 汇编 语言 转换 成 机 器 代码 。 在 这 一 层次 上 ， 用 户 也 基本 上 看 不 到 较 低级 的 层次 。 虽 然 ， 编 程 人 员 必 
须知 道 数 据 类 型 和 可 用 的 各 种 指令 ， 但 是 不 必 了 解 这 些 指令 的 具体 执行 方式 。 

第 4 层 为 汇编 语言 层 (Assembly Language Level) ， 它 包含 某 种 类 型 的 汇编 语言 。 如 上 所 述 ， 编译 
过 的 高 级 语言 首先 翻译 成 汇编 语言 ， 然 后 汇编 语言 直接 转换 成 机 器 代码 。 这 是 “一 对 一 ”的 翻译 过 程 ， 
也 就 是 说 二 条 汇编 语言 的 指令 会 被 严格 翻译 成 一 条 机 器 语言 的 指令 。 由 于 具有 这 些 独立 的 层次 ”所 以 
我 们 就 可 以 在 应 用 过 程 中 缩小 高 级 语言 《例如 C++ 语言 ) 与 实际 机 器 语言 《由 一 些 0 和 1 序列 组 成 语 
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言 ) 之 间 的 诗 义 上 的 间隙 。 

第 3 层 为 系统 软件 层 (System Software Level) ， 主 要 处 理 操作 系统 指令 。 这 一 层次 负责 多 用 户 编 
程 ， 存 储 器 保护 ， 过 程 同 步 和 其 他 一 些 重 要 功能 。 通 常 ， 从 汇编 语言 翻译 过 来 的 机 器 请 言 指令 可 以 直 
接 越 过 这 一 层 而 不 会 被 修改 。 

第 2 层 是 指令 集体 系 结构 〈Instruction Set Architecture，ISA) ， 或 称 为 机 器 层 (Machine Level)， 
它 由 特殊 的 计算 机 系统 结构 所 能 识别 的 机 器 语言 组 成 。 使 用 一 种 计算 机 的 真正 的 机 器 语言 编写 的 程序 
可 以 在 一 个 由 硬 连 线 组 成 的 计算 机 中 直接 用 电路 来 执行 ， 而 不 再 需要 任何 解释 程序 、 翻 译 程序 或 者 是 
编译 程序 。 读者 将 会 在 第 4 章 和 第 5 章 中 深入 学 习 指 令 集 体系 结构 。 

第 1 层 为 控制 层 〈Control Level) 。 在 这 个 层次 上 ， 控 制 单元 (control unit) 将 确保 正确 地 译 码 并 
执行 指令 ， 并 且 适 时 地 将 数据 传送 到 正确 的 位 置 。 控 制 单元 会 逐条 解释 从 上 层 传 送 过 来 的 机 器 指令 ， 
一 次 解释 一 条 指令 ， 指 挥 机 器 执行 所 要 求 的 正确 动作 。 

控制 单元 的 设计 有 两 种 方式 : 一 种 是 导线 直接 连接 ( 称 为 硬 连 线 ，hardwired)， 另 一 种 是 微 程序 
控制 (或 称 为 微 编程 ，microprogrammed)。 在 使 用 硬 连 线 的 控制 单元 中 ， 控 制 信和 号 由 数字 逻辑 部 件 的 
电路 模块 发 送出 来 。 这 些 控制 信号 指引 着 各 种 数据 和 指令 流向 系统 的 合适 部 位 。 通 常 ， 硬 连 线 的 控制 
单元 的 速度 非常 快 ， 因 为 它们 都 是 一 些 真 实 的 物理 部 件 。 但是， 一 旦 这 些 硬 连 线 的 控制 单元 的 实现 完 
成 后 ， 就 很 难 再 进行 修改 。 

设计 控制 单元 的 另 一 种 选择 是 使 用 一 个 微 程序 来 执行 指令 。 微 程序 是 一 个 利用 某 种 低级 语言 编写 
的 程序 ， 这 种 低级 语言 可 以 由 硬件 直接 执行 。 在 计算 机 的 第 二 个 层次 上 生成 的 机 器 指令 将 被 输入 到 这 
个 微 程序 中 ， 再 由 微 程 序 来 解释 各 种 指令 ， 然 后 激活 硬件 执行 原始 指令 。 一 条 机 器 层次 的 指令 通常 被 
翻译 成 几 个 微 代 码 指令 。 这 种 翻译 过 程 不 再 具有 汇编 语言 和 机 器 语言 之 间 存 在 的 一 一 对 应 关系 。 微 程 
序 方 式 的 控制 单元 非常 流行 ， 因 为 对 它们 进行 修改 要 相对 容易 一 些 。 当 然 ， 微 编程 的 缺点 也 是 显 而 易 
见 的 。 由 于 增加 了 额外 的 翻译 过 程 ， 通 常 这 种 方法 执行 指令 的 速度 会 比较 慢 。 

第 0 层 是 数字 逻辑 层 〈Digital Logic Level) ， 在 这 里 我 们 所 面 对 的 是 计算 机 系统 的 物理 构成 : 各 种 
逻辑 门 和 引线 。 这 些 都 是 基本 的 构造 模块 和 数学 逻辑 的 实现 ， 它 们 是 各 种 计算 机 系统 的 共同 部 件 。 第 
3 章 将 详细 介绍 计算 机 的 数字 逻辑 层 。 


1.7 冯 ， 诺 伊 曼 模型 


在 最 早期 的 电子 计算 机 器 中 ， 编 程 就 是 利用 各 种 导线 进行 接 插 连 线 。 由 于 没有 计算 机 的 分 层 结构 ， 
对 早期 的 计算 机 进行 编程 可 以 说 是 电气 工程 上 的 一 大 壮举 ， 哪 怕 程 序 仅仅 是 算法 设计 中 的 一 个 小 练习 
题 。 在 完成 ENIAC 的 工作 前 ，John W. Mauchly 和 J. Presper Eckert 构思 设计 了 一 种 可 以 改变 计算 机 
器 的 运行 状态 的 简易 方法 。 他 们 依赖 于 一 种 利用 条 延迟 线形 式 的 存储 设备 ， 可 以 提供 一 种 存储 程序 指 
令 的 方法 ， 从 而 在 每 次 求解 新 问题 或 者 对 原来 的 程序 进行 调试 时 ， 不 必 寺 对 系统 进行 重新 连 线 。 
Mauchly 和 Eckert 将 他 们 的 想法 写成 文字 计划 ， 乔 望 以 此 作为 他 们 下 -… 代 的 计算 机 EDVAC 的 基础 。 
不 巧 的 是 ， 当 时 正 值 第 二 次 世界 大 战 ， 由 于 他 们 置身 于 最 高 机 密 的 ENIAC 计划 的 研究 中 ， 所 以 
Mauchly 和 Eckert 不 能 够 立即 发 表 这 个 具有 远见 的 构想 。 

但 是 ， 对 于 在 ENIAC 研究 计划 外 围 工作 的 许多 人 来 说 ， 并 不 存在 这 样 的 禁止 令 。 著 名 的 匈牙利 数 
学 家 冯 “ 诺 伊 曼 (John Von Neumman) 正 是 其 中 之 一 。 在 阅读 了 Mauchly 和 Eckert 有 关 EDVAC 的 
计划 书后 ， 汉 。 诺 伊 曼 发 表 和 公开 了 这 种 存储 器 的 思想 。 他 成 功 地 把 这 种 概念 公布 于 所， 结果 历来 人 
们 都 公认 这 是 他 的 一 大 发 明 。 现 在 ， 所 有 的 存储 程序 的 计算 机 都 称 为 使 用 冯 ， 诺 伊 曼 体系 结构 (Von 
Neumman architecture) 的 冯 ， 诺 伊 曼 系 统 。 尽 管 本 书 并 不 排斥 对 于 存储 程序 的 计算 机 使 用 冯 “。 诺 伊 曼 
体系 结构 的 这 种 传统 说 法 ， 但 是 我 们 在 这 里 也 不 能 不 对 这 种 思想 的 真正 发 明 人 John W、Mauchly 和 J 
Presper Eckert 给 予 应 有 的 称颂 和 尊重 。 

现代 版 本 的 存储 程序 的 计算 机 体系 结构 至 少 应 该 满足 以 下 的 基本 特征 : 
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。 由 三 大 硬件 系统 组 成 : 一 个 中 央 处 理 器 (central processing unit， CPU) ， 其 中 包含 一 个 控制 单 
元 ,一 个 算术 逻辑 单元 (arithmetic logic unit， ALU)， 若 干 个 寄存 器 (register， 一 些小 的 存储 
单元 ) 和 一 个 程序 计数 器 ; 一 个 主 存储 器 系统 (main-memory system) ， 用 来 保存 控制 计算 机 操 
作 的 各 种 程序 ;以 及 一 个 输入 /输出 〈I/O) 系统 。 

。 具 有 执行 顺序 指令 的 处 理 能 力 。 

.在 主 存储 器 系统 和 CPU 的 控制 单元 之 间 ， 包含 一 条 物理 上 的 或 者 是 逻辑 上 的 单一 通道 ， 可 以 强 
制 改变 指令 和 执行 的 周期 。 通 常 ， 这 种 单一 通道 称 作 冯 ，。 诺 伊 曼 壮 颈 (Von Neumman 
bottleneck)。 

图 1-4 给 出 了 现代 计算 机 系统 中 是 怎样 将 这 些 特性 组 合 在 一 起 的 。 注意 : 在 图 中 ， 系 统 的 所 有 IO 

都 是 通过 算术 人 逻辑 单元 连接 的 (实际 上 ， 它们 是 通过 累加 器 连接 的 ， 累 加 器 是 ALU 的 一 部 分 )。 这 种 
体系 结构 按 着 一 种 称 为 站。 诺 伊 曼 执 行 周期 (Von Neumman execution cycle) 的 方式 来 运行 程序 。 这 种 计 
算 机 的 工作 原理 又 称 为 取 指 - 译 码 -执行 周期 (fetch-decode-execute cycle) 。 这 种 周期 的 一 个 循环 过 程 如 下 : 


Cr ) : Co— | 





图 1-4 冯 ， 诺 伊 曼 体系 结构 

。 控制 单元 从 计算 机 的 存储 器 中 提取 下 一 条 程序 指令 ， 并 利用 程序 计数 器 来 决定 这 条 指令 的 所 在 

位 置 。 

。 对 提取 的 指令 进行 译 码 ， 变 成 ALU 能 够 理解 的 一 种 语言 。 

。 从 存储 器 中 取出 执行 指令 所 需 的 各 种 操作 数 的 数据 ， 并 把 它们 放大 CPU 的 寄存 器 中 。 

。ALU 执行 指令 ， 并 将 执行 的 结果 存放 到 寄存 器 或 者 存储 器 中 。 

汉 “。 诺 伊 曼 体系 结构 的 这 种 思想 已 经 得 到 了 很 大 的 发 展 。 现在 ， 我 们 可 以 在 程序 执行 之 前 ， 将 程 
序 和 数据 存放 在 某 种 慢 速 访问 存储 介质 中 〈 例 如 硬盘 )。 而 在 程序 执行 时 ， 再 将 这 些 程序 和 数据 复制 到 
二 个 快速 访问 的 易 失 性 的 存储 介质 中 〈 例 如 RAM)。 原来 早期 的 计算 机 体系 结构 也 已 经 逐渐 发 展 成 为 
现在 称 为 系统 总 线 模 型 〈system bus model) 的 计算 机 体系 结构 ， 如 图 1-5 所 示 。 计算 机 系统 中 的 数据 
总 线 将 数据 从 主 存储 器 中 传递 到 CPU 的 寄存 器 中 ， 反之 亦 然 。 同 时 ， 地 址 总 线 负 责 保持 数据 总 线 正 在 
访问 的 数据 地 址 。 而 控制 总 线 则 传送 各 种 必要 的 控制 信号 ， 以 指定 信息 传输 发 生 的 方式 。 

对 冯 。 诺 伊 曼 体系 结构 其 他 方面 的 一 些 改进 包括 : 采用 变 址 寄存 器 进行 编 址 ， 增 加 了 浮 点 数据 ， 
使 用 中 断 和 异步 的 1/O 结构， 增加 了 虚拟 存储 器 ， 以 及 增加 了 通用 寄存 器 。 在 本 书后 面 的 章节 中 ， 读 
者 可 以 进一步 了 解 有 关 这 些 结构 改进 方面 的 大 量 知识 。 i Kl , 
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存储 器 输入 输出 系统 











[ 
控制 总 线 
图 1-5 改进 后 的 汉 ， 诺 伊 曼 体系 结构 ， 增 加 了 系统 总 线 


1.8 非 冯 ， 诺 伊 曼 模型 


长 期 以 来 ， 几 乎 所 有 的 通用 计算 机 都 是 按照 汉 ，。 诺 伊 曼 体 系 结构 设计 的 。 然 而 ， 汉 ，。 诺 伊 曼 体 系 
结构 中 的 瓶颈 问题 使 工程 设计 人 员 一 直 未 能 找到 构建 廉价 且 与 大 部 分 商用 软件 兼容 的 快速 系统 的 途径 。 
显然 ， 未 受到 要 与 冯 ， 诺 伊 曼 体系 结构 保持 兼容 性 要 求 所 约束 的 工程 师 们 ， 就 可 以 自由 地 选择 使 用 许 
多 不 同 的 计算 模式 。 许 多 不 同 的 研究 领域 都 属于 非 汉 。 诺 伊 曼 模型 的 范畴 ， 包 括 神经 网 络 (利用 人 脑 
模型 的 思想 作为 计算 范式 )、 基 因 算 法 (利用 生物 学 和 DNA 演化 的 思想 开发 的 算法 )、 量 子 计算 (前 
面 业已 讨论 ) 和 并 行 计算 机 。 在 这 些 新 的 体系 结构 中 ， 并 行 计算 的 概念 是 目前 最 流行 的 。 

今天 ， 并 行 处 理解 决 了 我 们 面临 的 一 些 最 大 的 问题 ， 就 如 同 过 去 的 西部 开拓 者 使 用 并 排 的 牛 来 解 
决 当时 所 面临 的 一 些 大 问题 一 样 。 如 果 当 时 的 开拓 者 只 使 用 一 头 牛 ， 就 不 足以 搬 动 一 棵 大 树 。 由 于 当 
时 不 可 能 饲养 出 更 加 强壮 的 牛 ， 所 以 开拓 者 就 采用 两 头 牛 一 起 并 排 来 使 用 。 同 样 的 道理 ， 如 果 一 台 计 
算 机 不 够 快 ， 功 能 不 够 强大 ， 我 们 为 什么 不 简单 地 同时 使 用 多 台 计 算 机 ， 而 要 去 建造 更 快 和 功能 更 强 
大 的 计算 机 呢 ? 这 也 就 是 并 行 计算 机 所 要 做 的 事情 。 在 20 世纪 60 年 代 后 期 诞生 了 第 一 台 并 行 处 理 
的 计算 机 系统 ， 当 时 的 并 行 系统 只 有 两 个 处 理 器 。70 年 代 的 超级 计算 机 已 经 有 多 达 32 个 处 理 器 。 到 
了 80 年代， 有 些 系 统 已 经 拥有 超过 1 000 个 处 理 器 。1999 年 ，IBM 公司 宣布 建成 了 一 台 名 叫 蓝 色 基因 
(Blue Gene) 的 超级 电脑 。 这 台 巨 大 的 并 行 计算 机 包含 超过 100 万 个 处 理 器 ,每 一 个 处 理 器 都 有 自己 
专用 的 存储 器 。 当 时 ， 蓝 色 基 因 第 一 个 任务 就 是 分 析 蛋 白质 分 子 的 行为 。 

但 是 ， 即 使 是 并 行 计 算 也 有 它 的 局 限 性 。 随 着 处 理 器 数目 的 增加 ， 如 何 将 任务 分 配给 各 个 处 理 器 
的 上 层 管 理工 作 也 变 得 越 来 越 复杂 。 有 些 并 行 处 理 系统 需要 配备 额外 的 处 理 器 来 管理 其 他 处 理 器 以 及 
在 处 理 器 之 间 进 行 资 源 分 配 。 无 论 在 一 个 计算 机 系统 中 放 人 多 少 个 处 理 器 ， 也 不 管 分 配给 这 些 处 理 器 
多 少 资源 ， 都 会 遇 到 各 种 的 瓶颈 问题 。 当 然 ， 应 对 瓶颈 问题 的 最 好 方法 就 是 尽量 少 使 用 系统 中 最 慢 的 
部 分 。 这 是 从 Amdahl 定律 〈Amdahls Law) 中 所 衍生 出 来 的 一 种 思想 。Amdahi 定律 基本 表述 为 ， 对 
于 某 种 特定 的 系统 改进 ， 系 统 性 能 增强 的 可 能 性 受到 那些 被 改进 的 特征 部 位 的 使 用 次 数 的 限制 。 这 个 
定律 潜在 的 含义 是 ， 每 种 算法 都 会 有 顺序 执行 的 部 分 ， 算法 的 顺序 执行 部 分 最 终 将 会 限制 利用 多 处 理 
器 执行 时 所 能 够 获得 的 加 速 。 


本 章 小 结 


本 章 简要 介绍 了 计算 机 的 组 成 原理 和 体系 结构 ， 以 及 它们 之 间 的 区 别 。 同 时 ， 针 对 一 个 假想 的 计算 机 
广告 引 和 人 了 一 些 专业 名 词 和 术语 。 这 些 专 业 名 词 和 术语 将 会 在 后 面 的 学 习 章节 中 详细 介绍 。 

计算 机 在 历史 上 曾经 只 是 一 种 简单 的 计算 机 器 。 随 着 计算 机 的 发 展 越 来 越 先 进 ， 现 在 的 计算 机 系统 已 
经 变 成 一 种 通用 机 器 。 人 们 可 以 按照 不 同 的 需求 层次 来 看 待 计算 机 系统 ， 而 不 再 把 它 当 作 一 个 庞然大物 。 
计算 机 分 层 结构 中 的 每 一 层 都 有 特定 的 作用 ， 并 且 各 个 层次 都 有 助 于 缩小 高 级 编程 语言 〈 或 称 为 应 用 任务 ) 
与 组 成 计算 机 物理 硬件 的 逻辑 门 电 路 和 导线 之 间 存 在 的 语义 上 的 差距 。 对 于 程序 设计 人 员 来 说 ,也 许 在 计 
算 领 域 最 重要 的 发 展 是 引进 了 冯 “ 诺 伊 曼 体 系 结构 的 存储 程序 的 概念 。 尽 管 还 有 其 他 的 计算 机 的 体系 结构 
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模型 ， 但 是 冯 “' 诺 伊 曼 体系 结构 在 当今 的 通用 计算 机 系统 中 占 主导 地 位 。 
深入 阅读 

建议 读者 以 本 章 的 简单 阐述 为 基础 ， 阅 读 一 些 有 关 计 算 机 历史 方面 的 书籍 。 这 方面 的 内 容 有 些 是 关于 
历史 人 物 的 ， 有 些 是 关于 机 器 的 ， 很 容易 引起 读者 的 兴趣 。 其 中 一 本 是 John Atanasoff (1988) 在 Mollen- 
hoff 所 著 的 名 为 《被 遗忘 的 计算 机 之 父 》 (forgotten father of the computer) 的 书籍 。 该 书 描述 了 Atanasoff 
和 John Mauchly 之 间 非 常 奇特 的 关系 ,以 及 计算 机 界 的 两 位 巨人 Honeywell 和 Sperry Rand 之 间 的 法 律 官 
司 。 审 判 的 结果 最 终 给 了 Atanasoff 应 有 的 历史 地 位 。 

如 果 想 寻找 一 本 较 薄 的 有 关 计 算 机 历史 的 书籍 ， 不 妨 试 读 一 下 Rochester 和 Gantz (1983) 的 著作 。 而 
在 Augarten (1985) 的 著作 中 阐述 的 计算 机 历史 可 以 让 人 轻松 阅读 ， 书 中 包含 数 百 幅 难 得 一 见 的 早期 计算 
机 和 计算 设备 的 照片 。 如 果 要 了 解 计 算 机 历史 发 展 的 完整 过 程 ， 可 以 参阅 Cortada (1987) 的 3 卷 版 的 词 
典 。Ceruzzi (1998) 有 关 计 算 历 史 的 论述 非常 有 思想 深度 。 如 果 对 有 关 历 史 计 算 机 的 一 些 精 彩 案例 的 研究 
感 兴趣 的 话 ， 可 以 阅读 Blaauw 和 Brooks (1997) 的 著作 。 

通过 阅读 下 面 一 些 的 书籍 ， 读 者 同样 也 可 以 得 到 丰厚 的 回报 ， 其 中 包括 : McCartney (1999) 关于 
ENIAC 的 介绍 ，Chopsky 和 Leonsis (1988) 有 关 IBM PC 的 历史 发 展 过 程 ， 以 及 Toole (1998) 有 关 Love- 
lace 伯 档 夫人 Ada 的 传记 等 。Polachek (1997) 的 文章 向 读者 展现 了 一 幅 有 关 计 算 弹道 射击 表 的 复杂 性 的 
生动 丽 面 。 读 过 这 篇 文章 后 ， 你 就 会 发 现 军 方 为 什么 愿意 对 那些 能 够 使 计算 过 程 变 得 更 快 和 更 精确 的 承诺 
付出 任何 代价 。Maxfield 和 Brown (1997) 的 书 则 从 一 个 神奇 的 角度 来 看 待 计算 的 起 源 和 历史 ， 并 且 深 刻 
透彻 地 解释 了 计算 机 的 工作 原理 。 

要 了 解 有 关 摩 尔 定律 的 更 多 资料 ， 可 以 参阅 Schaller (1997) 的 文献 。 有 关 旱 期 计算 机 的 详细 描述 和 
计算 机 工业 的 先驱 者 的 回忆 和 生平 简介 ， 可 以 参考 季刊 [EEE Annals of the History of Computing 。 计 算 
机 博物 馆 历史 中 心 可 以 直接 从 网 址 www. computerhistory. org 找到 。 在 这 里 有 各 种 各 样 的 展览 、 研 究 报 
告 、 历 史 回 顾 和 各 种 收藏 品 。 现 在 ， 许 多 城市 都 设立 了 计算 机 博物 馆 ， 参 观 者 可 以 接触 到 一 些 老式 的 计 
算 机 。 

读者 可 以 在 本 章 中 所 列举 (或 者 没有 列举 ) 的 一 些 制 定 标准 化 规则 的 组 织 的 网 站 找到 有 关 计 算 机 的 大 
量 信息 。 下 面 是 有 关 网 站 的 网 址 ;IEEE 的 网 站 www. ieee. org ，ANSI 的 网 站 www. ansi. org ，ISO 的 网 站 
www. iso. ch，BSI 的 网 站 www. bsi-global. com ， 以 及 ITU-T 的 网 站 www. itu. int 。ISO 的 网 站 中 提供 了 
大 量 有 关 计 算 机 的 信息 和 计算 机 标准 的 参考 文件 。 

WWW 计算 机 体系 结构 的 网 站 主页 www. cs. wisc, edu/ ~arch/www/ 包含 与 计算 机 体系 结构 相关 的 信 
息 的 完整 索引 。 许 多 USENET 的 新 闻 小 组 都 对 计算 机 有 关 的 题 日 进行 讨论 并 发 表意 见 ， 其 中 包括 
comp. arch 和 comp. arch. storage 。 

在 麻 省 理工 学 院 (MIT) 的 期 刊 杂志 Technology Review 的 2000 年 5/6 月 号 中 ， 整 期 刊载 了 有 关 计 算 
机 体系 结构 的 内 容 ， 这 些 文章 可 能 是 未 来 计算 机 的 基础 。 这 一 期 的 内 容 很 值得 一 读 ， 当 然 这 本 和 杂志 每 一 期 
的 内 容 都 值得 一 读 。 
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基本 概念 和 术语 复习 


oo -oh of 一 


Fe on- 一 一 一 一 一 
Do 


. 计算 机 组 成 原理 和 计算 机 体系 结构 之 间 有 什么 区 别 ? 

. 什么 是 ISA? 

. 计算 机 的 硬件 和 软件 等 效 原理 有 什么 重要 性 ? 

. 列举 计算 机 的 3 种 基本 部 件 。 

,前缀 giga- 表 示 10 的 多 少 次 窜 ? 它 近似 等 于 2 的 多 少 次 宕 ? 
,前缀 micro- 表 示 10 的 多 少 次 赛 ? 它 近似 等 于 2 的 多 少 次 寡 ? 
. 通常 用 来 测量 计算 机 时 钟 频率 的 单位 是 什么 ? 

. 列举 两 种 类 型 的 计算 机 存储 器 。 

. IEEE 组 织 的 基本 任务 是 什么 ? 


. 最 初 使 用 ISO 缩写 的 组 织 的 全 名 是 什么 ? ISO 是 取 英 文 首 写字 母 的 缩写 吗 ? 
. ANSI 是 哪个 组 织 的 英文 名 称 的 首 写字 母 的 缩写 ? 

.专门 负责 有 关 电话 、 电 信和 数据 通信 事务 的 瑞士 组 织 的 名 称 是 什么 ? 
. 谁 被 称 为 计算 机 之 父 ? 为 什么 ? 

. 穿孔 卡片 在 计算 机 发 展 史上 有 什么 重要 意义 ? 

. 列举 两 个 推动 计算 机 发 展 的 重要 因素 。 

. 是 什么 原因 使 得 晶体 管 比 真空 管 有 了 如 此 大 的 改进 ? 

. 集成 电路 与 晶体 管 有 什么 不 同 ? 

. 解释 SSI、MSI、LSI 和 VLSI 之 间 的 区 别 。 

. 是 什么 技术 催生 了 微型 计算 机 的 发 展 ? 

. “开放 的 体系 结构 ”意味 着 什么 ? 


. 阐述 摩尔 定律 ， 摩 尔 定律 能 够 永远 保持 下 去 吗 ? 
. Rock 定律 与 摩尔 定律 是 如 何 相 互 关联 的 ? 
. 阅 述 和 解释 大 家 所 公认 的 计算 机 分 层 结构 中 的 7 个 不 同 层次 。 这 种 分 层 结构 对 于 理解 计算 机 系统 有 什 


么 帮助 ? 
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油 
二 





24. 
25. 
26. 
27. 
28. 


冯 ，。 诺 伊 曼 体 系 结构 与 它 以 前 的 计算 机 体系 结构 有 什么 不 同 ? 
阐述 冯 ， 诺 伊 曼 体系 结构 的 特点 。 

取 指 - 译 码 -执行 周期 的 工作 原理 是 怎样 的 ? 

并 行 计 算是 什么 含义 ? 

Amdahl 定律 内 在 的 前 提 含 义 是 什么 ? 


练习 题 


S1. 
2. 


多 7. 


8. 
9. 


计算 机 的 硬件 和 软件 在 哪些 方面 不 同 ” 而 在 哪些 方面 又 是 相同 的 ? 
a) 1 秒 等 于 多 少 毫 秒 (ms)? 

b) 1 秒 等 于 多 少 微 秒 (ps)? 

c) 1 毫秒 等 于 多 少 纳 秒 (ns)? 

d) 1 毫秒 等 于 多 少 微 秒 ? 

e) 1 微 秒 等 于 多 少 纳 秒 ? 

f) 1 千 兆 字 节 (GB) 等 于 多 少 千 字 节 (KB)? 
g) 1 兆 字 节 (MB) 等 于 多 少 千 字 节 (KB)? 
h) 1 千 兆 字 节 (GB) 等 于 多 少 兆 字 节 (MB)? 
i) 20 兆 字 节 (MB) 等 于 多 少 字 节 (B)? 

j) 2 千 兆 字 节 (GB) 等 于 多 少 千 字 节 (KB)? 


. 在 纳 秒 范 围 内 运行 的 物体 比 在 毫秒 范围 内 运行 的 物体 快 多 少 个 数量 级 ? 
. 假设 准备 购买 一 台 个 人 使 用 的 计算 机 。 首 先 ， 要 从 一 些 不 同 的 杂志 和 报纸 上 阅读 有 关 的 广告 ， 并 把 一 些 


不 太 懂 的 项 目 和 术语 记录 下 来 。 然 后 ， 查 阅 计算 机 字典 ， 写 出 这 些 项 目 和 术语 的 简短 解释 。 分 析 一 下 哪 
些 重 要 因素 会 影响 到 选择 计算 机 系统 的 决定 ， 并 将 这 些 要 素 列 出 来 。 在 选择 好 你 所 希望 购买 的 系统 后 ， 请 
确认 一 下 系统 规格 说 明 中 有 了 哪些 项 目 是 有 关 计 算 机 硬件 的 ， 而 哪些 项 目 是 有 关 计 算 机 软件 的 ? 


. 挑选 一 种 你 最 喜欢 的 计算 机 语言 编写 一 个 小 程序 。 在 对 程序 进行 编译 后 ， 看 一 下 是 否 可 以 确定 源 代 码 的 


指令 与 由 编译 器 产生 的 机 器 语言 指令 的 比例 是 多 少 ? 如 果 增 加 一 行 源 代 码 ， 会 对 机 器 语言 的 程序 有 何 影 
响 ? 现在 添加 一 些 不 同 的 源 代码 指令 ， 例 如 先 添加 一 条 加 法 指令 ， 然 后 青 添加 一 条 乘法 指令 。 请 问 机 器 
代码 文件 的 大 小 会 随 着 不 同 的 指令 发 生 什么 变化 ?并 给 出 对 结果 的 意见 和 看 法 。 


. 下 面 对 本 章 第 1.5 节 的 评论 做 出 回应 ， 如 果 现 在 才 发 明 计算 机 的 话 ， 你 认为 应 该 给 计算 机 肥 一 个 什么 样 


的 名 字 ? 答案 中 至 少 给 出 一 条 好 的 理由 。 

假设 现在 的 集成 电路 芯片 上 一 个 晶体 管 的 尺寸 是 2 微米 ， 请 问 根 据 摩尔 定律 ， 两 年 后 晶体 管 的 尺寸 将 会 
有 多 大 ? 摩尔 定律 与 程序 设计 人 员 之 间 怎 样 相互 关联 ? 

当时 是 什么 样 的 环境 背景 帮助 IBM 公司 取得 如 此 成 功 ? 

列举 个 人 计算 机 的 五 种 基本 应 用 。 计 算 机 的 应 用 存在 哪些 限制 ? 你 能 否 想 像 出 计算 机 在 不 久 的 将 来 会 和 
现在 完全 不 同 ， 而 且 是 激动 人 心 的 应 用 吗 ? 如 果 有 ， 可 能 是 什么 样 的 应 用 ? 


10. 在 汉 “， 诺 伊 曼 体 系 结构 的 计算 机 系统 中 ， 一 个 程序 和 相关 的 数据 都 存储 在 存储 器 中 。 如 果 某 个 程序 原 


以 为 在 存储 器 的 某 个 位 置 保 存 有 一 段 数 据 ， 但 实际 上 这 个 位 置 却 存储 一 段 程序 指令 。 这 样 一 来 ， 程 序 
就 可 能 会 在 无 意 中 (或 者 是 有 意识 地 ) 修改 程序 本 身 。 对 于 一 个 程序 设计 员 来 说 ， 这 种 情况 的 出 现 意 
味 着 什么 含义 ? 


.阅读 一 份 当地 的 报纸 ， 或 者 浏览 因特网 上 的 一 些 最 流行 的 职业 介绍 网 站 ， 搜 索 有 关 计 算 机 方面 的 招聘 


信息 。 说 明 哪 些 工作 明确 地 要 求 计算 机 硬件 的 知识 ”而 哪些 工作 又 上 暗示 了 对 计算 机 硬件 知识 的 需求 ? 
要 求 的 硬件 知识 与 招聘 公司 本 身 或 者 是 公司 的 地 理 位 置 之 间 有 何 关 联 ? 





没有 算术 的 生活 将 会 是 什么 ? 这 是 一 个 多 么 怒 怖 的 情景 。 
-Sydney Smith (1835) 


第 2 章 计算 机 系统 中 的 数据 表示 方法 


2.1 概述 


任何 计算 机 的 组 成 在 很 大 程度 上 取决 于 数字 、 字 符 和 控制 信息 的 表示 方法 。 反 之 亦 然 : 许多 年 来 
建立 起 米 的 一 些 标准 和 惯例 已 经 决定 了 计算 机 组 成 的 某 些 特定 的 方面 。 本 章 主 要 描述 计算 机 对 数字 和 
字符 进行 存储 和 操作 的 的 各 种 方法 。 下 面部 分 所 阐述 的 思想 将 形成 理解 各 种 不 同类 型 数字 计算 机 系统 
的 组 成 和 功能 的 基础 。 

数字 计算 机 中 最 基本 的 信息 单元 被 称 为 一 位 〈bit) 。 它 是 二 进 制 数 〈binary digit) 的 英文 缩写 。 具 
体 说 来 ， 一 个 位 不 过 是 代表 了 计算 机 的 电子 电路 中 的 “ 开 ” 或 者 “ 关 ” 的 状态 (或 者 是 电位 的 “高 ” 
或 “ 低 ”)。1964 年 ，IBM system/360 大 型 机 的 设计 者 建立 了 一 套 以 8 个 位 为 一 组 作为 计算 机 存储 器 纺 
址 的 基本 单元 的 约定 。 他 们 称 这 种 8 个 数位 的 组 合 为 一 个 字 节 (byte)。 

计算 机 的 字 (word) 由 两 个 或 者 多 个 相 邻 的 字 节 构成 。 计 算 机 的 字 有 时 用 来 对 存储 器 进行 编 址 ， 
多 数 情况 下 总 是 把 字 作 为 一 个 集合 来 处 理 。 字 的 大 小 〈word size) 表示 了 一 个 特定 的 计算 机 体系 结构 
能 够 处 理 的 最 有 效 的 数据 的 大 小 。 计 算 机 的 字 可 以 是 16 位 、32 位 、64 位 或 者 是 计算 机 组 成 内 容 中 有 
意义 的 其 他 位 数 〈 包 括 不 是 8 的 倍数 的 位 数 )。8 位 字 节 可 以 被 对 半分 成 两 个 4 位 ， 称 为 半 字 节 (nib- 
ble， 或 nybble) 。 因 为 一 个 字 节 的 每 一 位 在 位 置 编码 计数 系统 中 都 具有 一 个 明确 的 值 。 所 以 ， 包 含 最 小 值 
二 进 制 数字 的 半 字 节 称 为 低 半 字 节 ， 而 另外 的 半 个 字 节 称 为 高 半 字 节 。 


2.2 位 置 编码 系统 


直到 在 16 世纪 的 某 个 时 期 ， 欧 洲 才 采用 了 十 进 制 数 字 (基数 为 10) 的 计数 体系 〈 或 称 为 数 制 ) 。 
而 此 前 阿拉 伯 和 印度 已 经 使 用 十 进 制 数 近 一 千年 了 。 今 天 ， 我 们 理所当然 地 认为 ， 数 字 243 代表 的 是 2 
个 100 加 上 4 个 10， 青 加 上 3 个 整数 。 虽 然 ，0 表示 什么 都 没有 。 但 事实 上 ， 大 家 都 知道 1 和 10 这 两 
个 数 所 代表 的 意义 有 着 实质 性 的 差别 。 

位 置 编码 系统 (positional numbering systems) 所 包含 的 基本 思想 是 ， 任 意 数字 的 值 都 可 以 通过 表 
示 成 某 个 基数 (或 称 为 底 ，radix) 的 乘客 形式 。 这 种 计数 体系 通常 也 称 为 权重 编码 系统 (weighted 
numbering system) ， 因 为 数 的 每 一 个 位 置 都 是 基数 的 寡 次 方 。 

位 置 编码 系统 中 所 使 用 的 有 效 数 字 的 数目 等 于 系统 的 基数 的 大 小 。 例 如 ， 在 十 进 制 体系 中 有 10 个 
数字 0 到 9， 而 在 三 进 制 体系 〈 基 数 为 3) 中 的 数字 为 0、1 和 2。 任何 一 种 计数 体系 〈 数 制 ) 中 的 最 大 
的 合法 数字 均 为 基数 减 1。 所 以 ,在 任何 基 〈 数 ) 小 于 9 的 计数 体系 中 ，8 都 是 非法 的 数字 。 为 了 区 
别 ， 不 同 的 基 采 用 下 标的 形式 来 表示 ， 例 如 33ie ， 表 示 十 进 制 数 33 (本 书 中 没有 下 标的 数 都 假定 为 十 
进 制 数 )。 任 意 十 进 制 数 都 可 以 严格 地 采用 其 他 任意 的 整数 基数 制 来 表示 (参见 例 2-1)。 

例 2-1 将 3 个 十 进 制 数 表 为 下 列 不 同 基数 的 寡 指 数 形 式 。 

243. 5110 二 2X102 十 4X101 十 3X10° 十 5X10-! 十 1xX107? 

2123=2X32 二 1X3!+2X30==2310 
101102 二 1X24 二 0X23 十 1 X22 十 1 X21 十 0X20==2210 二 

在 计算 机 科学 中 ， 两 个 最 重要 的 数 制 是 二 进 制 数 〈 基 数 为 2》 和 十 六 进 制 数 〈 基 数 为 16) 。 另 外 一 

个 比较 重要 的 数 制 是 八进制 数 〈 基 数 为 8) 。 二 进 制 数 只 采用 0 和 1 两 个 数字 ， 八 进 制 计数 体系 采用 0 
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到 7 八 个 数字 ， 而 十 六 进 制 计 数 体系 除了 0 到 9 十 个 数字 外 ， 还 使 用 A、B、C、D、E 和 下 来 表示 数字 
10 到 15。 图 2-1 给 出 了 某 些 常用 数 制 的 表示 方法 。 


十 进 制 数 | 4 位 二 进 制 数 | “十 六 进 制 数 








避 o、~gDOn>mDPP 一 口 





215 = 32 768 
216 = 65 536 





了 了 站 口 口 四 ODN、VDom 上 wb 


图 2-1 计算 机 中 常用 的 数 制 


2.3 十 进 制 数 和 二 进 制 数 之 间 的 转换 


Gottfried Leibniz (1646 一 1716) 率先 将 十 进 制 〈 位 置 编码 ) 计数 体系 的 思想 推广 应 用 到 其 他 的 数 
制 体系 。 作 为 一 位 思想 深 徐 的 数学 家 ，Leibniz 对 二 进 制 计数 制 的 发 展 有 着 卓越 的 贡献 。 他 将 任意 一 个 
整数 都 可 以 通过 一 系列 由 0 和 1 来 表示 这 个 事实 与 上 帝 从 虚无 (0) 中 创造 宇宙 〈1) 的 思想 联系 起 来 。 
直到 20 世纪 40 年 代 后 期 ， 第 一 台 二 进 制 数字 计算 机 建成 之 前 ， 这 种 二 进 制 计数 体系 对 人 们 来 说 也 只 
不 过 是 一 个 数学 上 的 新 奇 事物 而 已 。 而 在 今天 ， 二 进 制 计数 体系 实质 上 已 经 成 为 所 有 依赖 于 数字 控制 
的 电子 设备 的 核心 基础 。 

因为 二 进 制 数 制 的 计数 方法 十 分 简单 ， 所 以 可 以 很 方便 地 将 二 进 制 数 翻译 转换 成 对 应 的 电子 电路 ， 
并 且 十 分 易于 理解 。 有 经 验 的 计算 机 专业 人 士 一 眼 就 可 以 识别 较 小 数值 的 二 进 制 数 〈 例 如 图 2-1 中 所 
列 出 来 的 二 进 制 数 ) 。 但 是 ， 对 于 较 大 数值 的 二 进 制 数 和 分 数 的 转换 ， 通 常 需要 用 计算 器 或 者 在 纸 上 用 
笔 来 完成 。 还 好 ， 这 些 转换 技术 只 要 稍 加 练习 就 很 容易 掌握 。 下 面 将 介绍 几 个 简单 的 转换 方法 和 技巧 。 


2.3.1 无 符号 整数 的 转换 


先 从 无 符号 数字 开始 ， 进 行 不 同 基数 之 间 的 数字 转换 。 带 符号 数字 〈 数 字 可 以 是 正 数 或 负数 ) 的 转 
换 要 复杂 一 些 。 重 要 的 是 ， 在 进行 带 符号 数字 的 转换 前 ， 首 先 需要 掌握 一 些 数字 间 相 互 转换 的 基本 技巧 。 

不 同 基数 的 计数 体系 (简称 数 制 ) 之 间 的 转换 ， 可 以 采用 重复 减法 或 者 是 除法 余数 方法 来 完成 。 
重复 减法 的 方法 比较 麻烦 ， 并 且 要 求 对 所 使 用 的 基数 的 寡 指 数 形式 比较 熟悉 。 由 于 更 加 直观 的 缘故 ， 
下 面 首先 介绍 重复 减法 的 转换 方法 。 

例如 ， 将 十 进 制 数 1041o 转 换 成 三 进 制 数字 。 大 家 知道 ，31 二 81 是 小 于 104 的 3 的 最 大 乘 寡 数值 。 
因此 ， 所 转换 的 数 在 以 3 为 基数 的 数 制 中 会 占有 5 个 数字 宽度 每 位 数字 都 代表 了 基数 3 的 不 同 乘 震 
指数 ,0 到 4) 。 首 先 在 81 上 记 下 1， 并 从 104 中 减 去 81， 得 到 差 为 23。 很 显然 ， 接 下 来 3 的 宕 指数 为 
3，33 二 27 大 于 23， 不够 减 ， 在 该 位 上 记 下 0。 接 着 ， 看 一 看 23 除 以 3? 二 9 有 几 倍 。 不 难看 出 ， 应 该 
在 该 位 置 上 记 下 2， 并 从 23 中 减 去 18 余下 5。 再 从 5 中 减 3! 二 3， 该 位 记 1。 最 后 余 2， 即 为 2X3"。 
上 面 的 转换 步骤 如 例 2-2 所 示 。 


本 
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例 2-2 利用 减法 将 十 进 制 数 104lo 转 换 为 基 为 3 的 数字 。 


104 
一 81 王 34X1 
23 
一 0= 王 33X0 
23 
一 18 一 32X2 
5 
一 3 一 31 色 1 
2 
2=30X2 
0 10410 = 二 102123 加 


除法 -余数 方法 比重 复 减 法 要 简单 和 快速 一 些 。 采 用 连续 被 基数 相 除 的 思想 事实 上 与 连续 减 去 基数 
的 指数 宕 是 相同 的 。 连 续 被 基数 相 除 所 得 到 的 余数 就 是 转换 结果 的 数字 ， 阅 读 方法 是 从 下 往 上 进行 。 
这 种 方法 的 具体 操作 如 例 2-3 所 示 。 

例 2-3 利用 除法 余数 将 十 进 制 数 10416 转 换 为 基数 为 3 的 数字 。 


304 2 104 除 以 3 等 于 34 余 2 
3B4 1 34 除 以 3 等 于 11 余 1 
30l1 2 11 除 以 3 等 于 3 余 2 
3B 0 3 除 以 3 等 于 1 余 0 
3L 1 1 除 以 3 等 于 0 余 1 
0 
从 下 往 上 读 余数 ， 得 : 10410 二 102123。 | 


这 种 方法 适用 于 任何 基数 之 间 的 数字 转换 。 由 于 这 种 方法 计算 简便 ， 所 以 在 从 十 进 制 数 到 二 进 制 
数 的 转换 时 特别 有 用 。 例 2-4 给 出 了 一 个 这 样 的 转换 例子 。 
例 2-4 将 十 进 制 数 1471o 转 换 为 二 进 制 数字 。 


2147 147 除 以 2 等 于 73 余 1 
2[3 73 除 以 2 等 于 36 余 1 


218 18 除 以 2 等 于 9 余 0 
28 9 除 以 2 等 于 4 余 1 
2 上 0 4 除 以 2 等 于 2 余 0 
22E 0 2 除 以 2 等 于 1 余 0 
2 1 1 除 以 2 等 于 0 余 1 
0 
从 下 往 上 读 余数 ， 得 : 14710 王 100100112。 一 
一 个 N 位 的 二 进 制 数 可 以 表示 从 0 到 2N 一 1 范围 内 的 无 符号 十 进 制 整数 。 例 如 ，4 位 二 进 制 数 可 
以 表示 的 十 进 制 数值 是 0 到 15， 而 8 位 二 进 制 数 则 可 以 表示 0 到 255 之 间 的 数值 。 在 对 二 进 制 数 进行 
算术 运算 时 ， 一 个 给 定位 数 的 二 进 制 数 所 能 表示 的 数值 范围 是 非常 重要 的 。 考 虑 下 面 的 一 种 情形 ， 如 
果 二 进 制 数 的 长 度 是 4 位 ， 而 要 将 二 进 制 数 1111。 (15io) 与 1111z 相 加 。 很 明显 ，15 加 15 等 于 30， 
而 30 不 能 用 4 位 二 进 制 数 来 表示 。 这 种 现象 称 为 溢出 (overflow)， 通 常 发 生 在 对 无 符号 的 二 进 制 数 进 
行 算术 运算 时 ， 结 果 超 出 给 定位 数 的 二 进 制 数 所 能 表示 的 数值 范围 的 情形 。 在 本 章 第 2. 4 节 中 讨论 带 
符号 数 时 ， 将 会 对 溢出 现象 进行 详细 介绍 。 


2.3.2 分 数 转 换 
在 任意 数 制 中 ， 分 数 都 可 以 采用 其 他 数 制 中 基数 的 负 指 数 叶 来 近似 表示 。 利 用 小 数 点 〈radix 


1 
1 
2B6 0 36 除 以 2 等 于 18 余 0 
0 
1 
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point) 将 一 个 数 的 整数 部 分 和 分 数 部 分 分 开 。 十 进 制 数 中 的 小 数 点 称 为 十 进 制 小 数 点 ， 而 二 进 制 数 中 
的 小 数 点 称 为 二 进 制 小 数 点 。 二 进 制 分 数 采 用 二 进 制 小 数 点 来 表示 。 

如 果 在 某 个 数 制 表 示 中 ， 小 数 点 右边 包含 循环 重复 的 数字 串 的 分 数 ， 而 在 另 一 种 数 制 的 表示 中 就 
不 一 定 也 具有 重复 的 数字 序列 。 例 如 ，2/3 是 一 个 循环 的 十 进 制 分 数 ， 而 在 三 进 制 数 中 则 表示 为 
0.23 (2X3-1 王 2X1/3)， 不 再 有 数字 循环 。 

同样 ， 可 以 利用 类 似 于 整数 转换 所 使 用 的 重复 减法 和 除法 余数 方法 ， 来 进行 不 同 基数 体系 之 间 的 
分 数 转换 。 下 面 的 例 2-5 就 是 使 用 重复 减法 将 一 个 十 进 制 分 数 转 换 成 一 个 五 进 制 的 分 数 。 

例 2-5 将 0.4304io 转 化 为 基数 为 5 的 分 数 。 


0. 4304 
—0. 4000=5-1X2 
0.0304 


—0.0000=5-2X0 (一 个 占 位 符号 。) 
0. 0304 


一 0.0240 一 5-3X3 
0. 0064 


一 0.0064 一 5 4 义 4 
0. 0000 


从 土 往 下 读 右边 的 倍数 ， 得 : 0. 43041o 一 0. 20345 。 国 

在 使 用 余数 方法 进行 整数 转换 时 ， 是 利用 基数 的 正 指数 罕 原 理 来 进行 的 。 内 此 ， 可 以 合理 推断 在 
进行 分 数 转换 时 应 该 使 用 乘法 ， 央 为 分 数 是 按照 基 的 负 指 数 来 表示 的 。 但 是 ， 转 换 结果 不 是 像 前 面 所 
做 的 一 样 去 取 余 数 ， 而 是 在 每 次 乘 上 基数 后 ， 只 取 其 积 的 整数 部 分 。 最 后 的 结果 是 从 上 向 下 ， 而 不 是 
从 下 向 上 读 取 。 例 2-6 表示 的 就 是 一 个 分 数 的 转换 过 程 。 

例 2-6 将 0.430410 转 化 为 基数 为 5 的 分 数 。 


0. 4304 
x 5 
520 整数 部 分 为 2， 接 下 来 乘法 中 将 会 被 省 略 。 








一 一 


600 整数 部 分 为 0， 作为 一 个 占 位 符号 。 


Xo oo pn 





8000 ”整数 部 分 为 3， 接 下 来 乘法 中 将 会 被 省 略 。 
8 


Xo ¢ 
心 

OO 
a 


《4.0000 ”分 数 部 分 现在 为 0， 转换 完成 。 

从 上 向 下 读 取 整数 部 分 ， 结 果 为 : 0. 430410 二 0. 20345 。 国 

本 例 中 所 设计 的 转换 过 程 只 进行 了 几 步 就 完成 了 。 通 常 的 情况 并 不 会 如 此 简单 ， 经 常会 明 到 循环 
分 数 。 大 部 分 的 计算 机 系统 都 执行 某 些 特定 的 取舍 近似 算法 ， 以 保证 有 足够 的 转换 精度 。 但 是 本 书 中 
为 了 清楚 起 见 ， 在 达到 所 需要 的 精度 时 ， 只 是 简单 地 舍 去 或 者 删 去 ) 多 余 的 结果 。 参 见 例 2-7。 

例 2-7 转换 0.3437510 为 二 进 制 数 ， 小数点 的 的 右面 取 4 位 。 

0. 34375 


x 2 
0. 68750 。“〈 另 一 个 占 位 符号 。) 


: 0. 68750 
x 2 
1. 37500 


0. 37500 
XxX 2 
0.75000 
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0.75000 
x 


0000 (已 经 到 了 第 4 位， 就 此 停止 后 续 地 运算 。) 
从 上 向 下 读 取 ， 直 到 小 数 点 右面 的 第 4 位 ， 即 0. 343751o 一 0. 0101。 二 
前 面 所 描述 的 方法 可 以 用 来 进行 各 种 基数 之 间 的 任意 数字 的 直接 转换 ， 例 如 以 4 为 基 的 体系 和 以 
3 为 基 的 体系 之 间 的 数 的 转换 (如 例 2-8 所 示 )。 但 是 ， 大 多 数 情形 下 都 采用 先 把 数字 转换 成 以 10 为 基 
的 数 ， 再 将 其 转换 为 所 要 求 的 基数 。 这 种 方法 要 比 各 种 基数 之 间 的 直接 转换 快捷 和 精确 得 多 。 这 种 规 
则 存在 一 种 例外 情况 ， 就 是 以 2 的 指数 宕 组 成 的 基数 之 间 的 数字 转换 ， 在 下 面 的 章节 部 分 我 们 将 会 看 
到 这 种 转换 。 
例 2-8 将 四 进 制 数 31214 转换 为 三 进 制 数 。 
首先 转换 成 十 进 制 数 : 
312114 = 二 3X43 十 1 X42 十 2X4i 十 1X40 
二 3X64 十 1 X16 十 2X4 十 1=21716 
然而 转换 成 三 进 制 数 : 
3217 1 
3f2 0 
3B4 0 
3l8 2 
3l2 2 
0 结果 为 31214 一 220013 。 国 


2. 3.3 ”以 2 的 指数 需 为 基数 的 数 制 之 间 的 转换 


通常 可 以 将 二 进 制 数 表示 为 十 六 进 制 或 者 是 八进制 数 的 形式 ， 这 样 可 以 增加 二 进 制 数 的 可 读 性 。 
因为 16 二 2+， 以 4 位 为 一 组 ( 称 为 一 个 十 六 进 制 字 节 )， 很 容易 被 识别 为 一 个 十 六 进 制 的 数字 。 类 似 
地 ， 由 于 8=23，3 位 一 组 〈 称 为 一 个 入 进 制 字 节 ) 表示 一 个 八进制 的 数字 。 利 用 这 样 一 种 分 组 的 对 应 
关系 ， 可 以 很 方便 地 把 一 个 二 进 制 数 转换 为 八进制 数 或 者 是 十 六 进 制 数 。 

例 2-9 将 二 进 制 数 110010011101* 转换 成 八进制 数 和 十 六 进 制 数 。 

110 010 011 101 八进制 的 转换 以 3 位 二 进 制 数字 为 一 组 

6 2 3 5 110010011101z 一 62358 

1100 1001 1101 十 六 进 制 的 转换 以 4 位 二 进 制 数字 为 一 组 

C 9 DD 1100100111012 一 C9Di6 | 

如 果 分 组 的 数字 不 够 ， 可 以 在 前 面 添加 数字 0。 


2.4 带 符 号 整数 的 表示 方法 


前 面 已 经 了 解 了 怎样 在 不 同 的 基数 之 间 对 无 符号 整数 进行 转换 。 我 们 需要 一 些 附 加 的 信息 才能 表 
示 带 符号 的 数字 。 当 在 程序 中 声明 整数 变量 时 ， 许 多 编程 诸 言 都 会 自动 为 该 整数 变量 分 配 一 个 存储 空 
间 ， 并 把 该 存储 单元 的 第 一 位 作为 符号 位 。 根 据 惯例 ， 高 位 的 “1” 表 示 一 个 负数 。 这 种 存储 单元 可 以 
是 小 到 一 个 8 位 的 字 节 ， 也 可 以 大 到 几 个 字 ， 这 取决 于 编程 语言 和 计算 机 的 系统 。 符 号 位 后 面 其 余 的 
位 用 来 表示 数字 本 身 。 

怎样 表示 一 个 带 符 号 的 数字 取决 于 所 使 用 的 方法 。 通 常 有 三 种 途径 。 最 直观 的 方法 为 符号 幅 值 表 
示 法 ， 即 利用 符号 位 后 面 的 剩余 的 位 数 来 表示 数字 的 幅 值 (大 小 )。 这 种 方法 和 其 他 两 种 采用 互补 
(complement) 概念 的 表示 方法 将 在 下 面 的 章节 中 介绍 。 


2.4.1 符号 幅 值 表示 法 
至 此 ， 我 们 还 没有 讨论 如 何 利用 二 进 制 数 的 表示 方法 来 表示 负数 。 正 整数 和 负 整 数 的 集合 统称 为 
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带 符 号 的 整数 (signed integer) 。 将 带 符号 的 整数 表示 为 二 进 制 数值 的 关键 问题 是 符号 的 表示 方法 ， 即 
如 何 对 真实 数字 的 符号 进行 编码 。 符 号 幅 值 表示 法 (signedmagnitude reprcsentation) 就 是 解决 这 个 问 
题 的 一 种 方法 。 顾 名 思 义 ， 一 个 带 符号 - 幅 值 的 数字 的 最 左边 的 位 〈 也 称 为 高 位 ， 或 者 是 最 高 有 效 的 
位 ) 是 一 个 符号 ， 而 余下 的 位 用 来 表示 数值 的 幅 值 〈 或 称 为 绝对 值 )。 例 如 ,在 8 位 字 中 ， 一 1 表示 为 


只 有 7 位 可 以 用 来 作为 数字 幅度 的 实际 表示 。 这 就 是 说 ， 一 个 8 位 字 可 以 表示 的 最 大 整数 为 2 一 1， 即 
127 (高 位 为 0， 后 面 跟 7? 个 1)。 最 小 整数 为 8 个 1， 即 一 127。 央 此 ，N 位 能 够 表示 的 数 的 范围 为 
一 2CN- 1) 一] 至 一 (2N- DC—1), 

当然 ,计算机 必须 能 够 执行 采用 这 种 符号 表示 的 整数 的 算术 运算 。 对 符号 幅 值 表示 法 进行 的 算术 
运算 实际 上 与 人 们 通常 采用 纸 笔 方法 所 进行 的 运算 规则 是 相同 的 ， 但 是 这 种 运算 很 快 就 会 计 人 糊涂 起 
来 。 例 如 加 法 的 运算 规则 。(1) 如 果 符 号 相同 ， 大 小 相 加 ， 结 果 取 相同 的 符号 。(2) 如 果 符号 相反 ， 
必须 先决 定 哪 一 个 操作 数 的 幅 值 比较 大 。 结 果 的 符号 应 该 与 较 大 的 幅 值 的 操作 数 相同 ， 结 果 幅 值 的 大 
小 为 较 大 操作 数 的 幅 值 减 去 其 中 较 小 操作 数 的 幅 值 。 仔 细 思 考 一 下 这 种 运算 法 则 ， 这 就 是 我 们 通常 使 
用 的 带 符号 算术 的 手写 运算 方法 。 

我 们 可 以 基于 数 的 符号 ， 按 照 某 种 方式 来 安排 操作 数 的 次 序 ， 这 样 可 以 在 运算 时 不 必 考 虑 它们 的 
符号 。 而 只 要 在 计算 结束 后 加 上 止 确 的 符号 即 可 。 当 采用 上 述 思想 在 一 个 8 位 字 的 计算 机 系统 中 建立 
这 样 的 运算 规则 时 ， 需 要 非常 小 心地 进行 处 理 。 结 果 的 幅 值 只 能 有 7 位 ， 对 最 高 位 〈 符 号 位 ) 产后 的 
进位 必须 会 弃 。 

例 2-10 利用 符号 幅 值 算术 ， 对 二 进 制 数 01001111 和 001000112 进行 加 法 运算 。 





1111 二 进位 
0 1001111 (79) 
0 十 0100011 十 (35) 
0 1110010 (114) 


可 见 ， 如 同 十 进 制 加 法 一 样 ， 符 号 幅 值 表示 法 的 算术 运算 也 是 从 右 往 左 进行 直到 第 7 位 ,包括 其 
中 可 以 有 进位 。 但 是 ， 如 果 是 在 最 高 位 有 进位 ， 则 表示 有 溢出 发 生 ， 这 个 进位 将 会 被 丢弃 ， 而 导致 错 
误 的 求 和 结果 。 本 例 中 并 没有 发 生 这 种 溢出 。 

在 带 符号 幅 值 表 示 中 ， 上 例 的 计算 结果 为 010011112 十 001000112 二 01110010s。 国 

对 符号 位 进行 单独 处 理 ， 是 内 为 符号 位 只 在 加 法 完成 后 才 有 实际 的 意义 。 在 例 2-10 中 ， 所 进行 的 
是 两 个 正 数 的 求 和 ， 求 和 结果 也 是 正 数 。 如 果 运 算 结 果 的 符号 出 现 错误 ， 也 就 表示 带 符 号 的 数字 发 生 
了 溢出 现象 ， 其 计算 结果 也 是 错误 的 。 

在 符号 幅 值 表示 中 ， 符 号 位 仅仅 用 来 表示 数字 的 符号 ， 央 此 不 能 对 符 导 位 进行 进位 运算 。 如 果 产 
生 一 个 来 自 第 7 位 的 进位 ， 运 算 结 果 将 会 对 第 7 位 作 溢 出 处 理 ， 并 对 进位 进行 删节 ， 同 时 给 出 一 个 错 
误 的 结果 〈 例 2-11 就 是 发 生 这 种 溢出 情形 的 一 个 例子 )。 谨 慎 的 程序 员 为 了 避免 这 类 “ 百 万 美元 ”的 
错误 ， 通常 都 会 非常 仔细 地 检查 各 种 可 能 发 生 的 溢出 情况 ， 尽 可 能 防止 溢出 。 如 果 不 于 弃 洲 出 位 ， 就 
会 直接 进位 到 符号 位 ， 产 生 两 个 正 数 求 和 结果 为 一 个 负数 这 类 更 加 荒 廖 的 结果 (不 妨 可 以 设想 一 下 ， 
如 果 后 续 的 程序 还 要 对 该 结果 进行 平方 根 或 对 数 运算 ， 会 发 生 什 么 样 的 情况 ) 。 

例 2-11 利用 符号 幅 值 算术 ， 对 二 进 制 数 01001111 和 01100011s 进行 加 法 运算 。 





最 后 的 进位 1 1111 < 进位 
溢出 0 1001111 (79) 
被 据 弃 0 十 1100011 十 (99) 
0 0110010 (50) 
得 出 一 个 错误 结果 : 79 十 99 王 50。 [J 


与 加 法 运算 一 样 ， 符 号 幅 值 表示 法 的 减法 运算 也 可 以 用 类 似 于 十 进 制 算术 的 纸 笔 运算 方法 进行 ， 
只 是 有 时 需要 从 被 减 数 (minuend) 的 数字 上 进行 借 位 操作 。 
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例 2-12 利用 符号 幅 值 算术 ， 从 二 进 制 数 01100011* 中 减 去 二 进 制 数 010011112 。 





0112 夺 借 位 
0 110966011 (99) 
0 一 1001111 一 (79) 
0 0010100 (20) 
在 符 号 幅 值 表示 中 ， 最 后 的 运算 结果 为 : 011000112 一 010011112 二 00010100z。 国 


例 2-13 利用 符号 幅 值 算术 ， 从 二 进 制 数 01001111。(79) 中 减 去 二 进 制 数 01100011。(99)。 

仔细 观察 ， 不 难 发 现 减 数 01100011 要 比 被 减 数 01001111 大 。 从 例 2-12 的 结果 知道 ， 这 两 个 数 的 
差 为 000101002 。 因 为 减 数 比 被 减 数 大 ， 所 以 现在 所 要 做 的 就 只 是 改变 一 下 它们 之 间 的 差 值 的 符号 。 为 
此 ,在 符号 幅 值 表示 中 有 : 010011112 一 01100011? 二 000101002。 | 

大 家 知道 ， 减 法 运算 实际 上 就 是 加 上 与 减 数 相反 的 数 。 即 对 要 减 去 的 数字 取 其 负 值 ， 然 后 再 进行 
相 加 而 不 是 相 减 。 这 种 做 法 通常 要 比 执行 减法 的 借 位 运算 要 来 得 容易 ， 特 别 是 在 处 理 二 进 制 数 时 更 是 
如 此 。 这 里 先 回顾 一 下 加 法 运算 规则 :， (1) 如 果 符号 相同 ， 直 接 将 幅 值 相 加 ， 其 结果 取 相 同 的 符号 。 
(2) 如 果 符 号 不 同 ， 则 需要 先 确定 哪个 操作 数 的 幅 值 较 大 。 结 果 的 符号 与 幅 值 较 大 的 操作 数 相同 ， 而 
运算 结果 的 大 小 为 较 大 的 幅 值 减 去 较 小 的 幅 值 。 

例 2-14 利用 符号 幅 值 算术 ， 将 两 个 二 进 制 数 10010011; 〈 一 19) 和 00001011*。 (十 13) 相 加 。 

这 里 ， 第 一 个 数 〈 被 加 数 ) 为 负数 ， 其 符号 位 被 设 为 1。 而 第 二 个 数 〈 加 数 ) 为 正 数 ， 所 以 现在 
实际 上 要 做 减法 运算 。 首 先 ， 确 定 两 个 数 的 幅 值 的 大 小 ， 取 大 的 一 个 作为 被 减 数 ， 其 符号 就 是 运算 结 
果 的 符号 。 


0 12 夺 借 位 
1 00106011 (一 19) 
0 一 0001101 十 (13) 
1 0000110 (一 6) 
包括 符号 位 在 内 ， 符 号 - 幅 值 表象 中 的 计算 结果 为 ，10010011s 一 00001101? 王 10000110。 。 | 


例 2-15 利用 符号 幅 值 算术 ， 从 二 进 制 数 10101011。( 一 43)〉 中 减 去 二 进 制 数 10011000。(- 一 24)。 

可 以 先 将 减法 运算 转换 成 加 法 运算 ， 对 一 24 取 反 得 24， 青 加 上 一 43， 这 样 原来 的 减法 计算 变 成 了 
求解 新 的 问题 : 一 43 十 24。 由 上 上 述 的 加 法 规则 可 知 ， 巾 于 符号 不 同 ， 实 际 上 进行 的 运算 是 从 两 个 操作 
数 中 较 大 的 幅 值 中 减 去 较 小 的 幅 值 (或 者 说 从 43 中 减 去 24， 因 为 43 大 于 24)， 并 取 其 结果 为 负 值 。 





0 2 
0101011 (43) 
一 0011000 一 〈24) 
00i0011 C19) 
注意 ， 在 完成 减法 运算 前 这 里 并 没有 涉及 符号 问题 。 很 明显 ， 答 案 应 该 为 负 值 。 内 此， 符号 - 幅 值 
表象 中 最 后 的 计算 结果 为 : 10101011z 一 10001100z 一 100100112。 国 


在 讨论 前 面 这 些 例子 时 ， 读 者 也 许 会 产生 一 些 疑 问 ， 哪个 数字 较 大 ?怎样 减 去 一 个 负数 ?需要 从 
被 减 数 中 借 位 多 少 次 ? 不 难看 出 ， 按 照 上 面 这 种 工作 方式 设计 的 计算 机 在 执行 算术 运算 时 需要 做 出 如 
此 多 的 判断 和 决定 ， 尽 管 整个 计算 的 过 程 会 很 快 。 事 实 上 对 于 0 这 个 数 ， 符 号 - 幅 值 表象 中 有 两 种 表示 
方法 : 10000000 和 00000000。 从 数学 上 来 说 ， 这 种 情况 根本 就 不 可 能 发 生 ， 而 且 会 造成 逻辑 和 电路 上 
的 复杂 性 。 央 此 ， 利 用 较 简 单 的 方法 来 表示 带 符号 的 数字 ， 可 以 简化 计算 机 的 电路 和 降低 电路 的 成 本 。 
这 些 简单 的 表示 方法 就 是 基于 下 面 所 述 的 补 码 体系 的 原理 。 
什么 是 信和 胰 转 换 法 

一 种 将 二 进 制 数 转换 为 十 进 制 数 的 最 人 快 的 方法 称 为 倍 乘 转换 法 〈doubie-dabbie 或 double-dibble)。 
这 种 转换 方法 的 基本 思想 是 ， 二 进 制 数 的 各 位 中 ,每 个 后 面 的 位 的 2 的 乘 寡 〈 乘 方 ) 总 是 前 面 〈 其 右 
边 ) 位 的 2 的 乘 寡 的 2 倍 。 这 种 倍 乘 转换 方法 是 从 最 左边 的 位 开始 进行 计算 ， 将 第 一 位 乘 以 2 加 到 第 
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二 位 上 去 ， 得 到 的 和 再 乘 以 2 加 上 第 三 位 ， 依 此 类 推 ， 直 到 最 右边 的 位 。 

例 1 
将 二 进 制 数 10010011z 转换 成 十 进 制 数 。 
步骤 1: 写 下 该 二 进 制 数 ， 注 意 在 位 与 位 之 间 留 下 间隔 空间 。 

1 0 0 1 0 0 1 1 
步骤 2: 最 高 位 乘 以 2， 复 写 到 第 二 位 的 下 面 。 

1 0 0 1 0 0 1 1 

? 
2 


2 
步骤 3: 与 第 二 位 相 加 后 得 到 的 和 乘 以 2， 然 后 复写 到 第 三 位 的 下 面 。 
0. 0 1 0 0 1 1 


x2 x2 


2 

步骤 4: 重复 步骤 3， 直到 完成 所 有 的 位 。 
1 0 0 1 0 0 1 1 
2 4 8 18 36 72 146 


十 0 十 0 十 1 十 0 十 0 十 1 十 1 
2 4 9 18 36 73 147 一 最 后 的 结果 为 : 10010011z 一 147io 


X2 XxX2 XxX2 x2 x2 x2 Xx2 
2 4 8 18 36 72 146 


如 果 将 十 六 进 制 数 分 成 4 位 一 组 的 二 进 制 数 〈 反 之 亦 然 )， 运 用 倍 乘 转换 法 可 以 非常 方便 地 将 十 六 
进 制 数 转换 为 十 进 制 数 。 

例 2 

将 十 六 进 制 数 02CAls 转 换 成 十 进 制 数 。 

首先 ， 通 过 十 六 进 制 数字 进行 分 组 ， 并 将 十 六 进 制 数 转换 为 二 进 制 数 。 














0 2 C A 
0000 0010 1100 1010 
然后 ， 对 二 进 制 形式 的 数字 运用 倍 乘 转换 法 
1 0 1 0 0 1 0 1 0 
2 4 10 22 44 88 178 356 714 
to0 tl tl :+ + + +0 ++] +0 
2 5 11 22 44 89 178 357 714 
Xx2 x2 xz x2 x2 x2 x2 x2 x2 
2 4 10 22 44 88 178 356 714 
02CA16 = 二 1011001010z 一 71410 | 
2.4.2” 补 码 体系 


研究 算术 的 理论 工作 者 早 在 几 百 年 前 就 知道 在 十 进 制 数 中 的 碱 法 运算 中 ， 可 以 通过 加 上 减 数 与 全 
9 组 成 的 数字 的 差 ， 再 加 回 一 个 进位 的 方法 来 实现 。 这 种 方法 称 为 取 减 数 9 的 补 码 。 或 者 更 正规 地 说 ， 
求 减 数 的 十 进 制 反 码 (diminished radix complement) 。 例 如 ， 要 求 167 一 52 的 差 。 先 求 999 减 52 的 差 ， 
得 到 947。 这 样 ， 在 9 的 补 码 算 术 中 ， 有 167 一 52 二 167 十 947 二 114。 再 将 百 位 上 的 进位 1 加 回 到 个 位 
的 位 置 上 ， 就 得 到 了 正确 的 结果 167 一 52 二 115。 这 种 方法 通常 也 称 为 “计算 9 的 个 数 ”"， 并且 已 经 推广 
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到 二 进 制 数 体系 的 运算 中 ， 以 简化 计算 机 的 算法 。 这 种 补 码 体 系 相 对 于 符号 幅 值 的 表示 方法 来 说 ， 其 优 
点 就 是 不 再 需要 单独 处 理 符号 位 。 但 是 仍然 可 以 通过 检测 最 高 位 的 方法 ， 非 常 方便 地 了 解 一 个 数 的 符号 。 

理解 补 码 体系 的 另外 一 种 方法 是 ， 想 像 一 个 装 在 自行 车 上 的 里 程 表 的 工作 过 程 。 与 汽车 的 里 程 表 
不 同 ， 当 自行 车 做 逆向 骑 行 时 ， 自 行车 里 程 表 会 倒转 回去 。 假 定 自行 车 的 里 程 表 采用 3 位 数字 进行 计 
数 ， 例 如 表 的 计数 从 0 开始 ， 最 后 到 700 的 位 置 结束 。 对 此 ， 我 们 无 法 确定 自行 车 是 向 前 行驶 了 700 
英里 ， 还 是 向 后 逆向 行驶 了 300 英里 。 要 解决 这 一 问题 的 最 简单 的 方法 是 简单 地 把 计数 的 区 间 分 成 两 
半 ， 利 用 001 一 500 计算 正 的 里 程 数 ， 而 使 用 501 一 999 来 计算 负 的 里 程 数 。 这 样 就 可 以 有 效 地 把 计算 
的 距离 缩减 到 里 程 表 可 以 度量 的 范围 内 。 如 果 里 程 表 的 读数 为 997， 我 们 就 知道 自行 车 是 向 后 逆行 了 3 
英里 ， 而 不 是 向 前 行驶 了 997 英里 。501 一 999 表示 数字 001 一 500 的 补 码 (radix complement， 即 下 面 
将 要 介绍 的 两 种 方法 中 的 第 二 种 )， 并 用 来 表示 负 的 里 程 数 。 


| 反 袜 | 

如 上 所 述 ， 在 基数 为 10 的 计数 体系 中 ， 一 个 数 的 反 码 (one's complement， 又 称 为 1 的 补 码 ) 是 
通过 将 基数 减 去 1， 即 十 进 制 中 为 9， 再 减 去 该 数字 得 到 的 。 对 于 更 一 般 的 形式 ， 如 果 已 知 基 为 >， 有 
d 位 数字 ， 那 么 数字 N 的 反 码 定义 为 (rx 一 1) 一 N。 对 于 十 进 制 数 ，r 二 10， 基 数 减 一 就 是 10 一 1 一 9， 
例如 ，2468 的 十 进 制 反 码 为 9999 一 2468 王 7531。 这 在 二 进 制 数 的 体系 中 也 有 相同 操作 ， 即 从 一 个 较 小 
的 基 〈2) 中 减 去 1， 即 为 1。 例如，0101s 的 反 码 为 1111: 一 0101= 王 1010。 虽 然 我 们 也 可 以 按照 前 面 讨 
论 的 方法 繁琐 地 进行 借 位 和 减法 运算 来 计算 反 码 ， 但 做 几 个 实验 就 可 以 发 现 ， 构 成 一 个 二 进 制 数 的 反 
码 很 简单 ， 就 像 将 所 有 的 1 切换 为 0， 或 者 是 将 所 有 的 0 切换 为 1 一 样 。 在 计算 机 硬件 中 ， 要 实现 这 种 
切换 翻 位 的 操作 是 一 件 非 常 容易 的 事情 。 

值得 注意 的 是 ， 尽 管 我 们 可 以 求 出 任意 十 进 制 数 和 二 进 制 数 的 反 码 ， 但 是 在 这 里 最 重要 的 是 怎样 
利用 反 码 形式 来 表示 负数 。 大 家 知道 ， 进 行 一 个 减法 运算 ， 比 如 10 一 7， 也 可 以 设想 为 “加 上 一 个 相 
反 的 数 "， 这 就 是 10 十 (一 7)。 利 用 反 码 表示 法 可 以 将 减法 运算 转换 成 加 法 的 运算 形式 ， 以 简化 减法 
运算 。 同 时 ， 反 码 表示 法 也 提供 了 一 种 表示 负数 的 方法 。 这 里 ， 我 们 不 想 使 用 特殊 的 二 进 制 位 来 表示 
符号 (就 像 在 符号 - 幅 值 表象 中 所 做 的 那样 );， 所 以 需要 记 住 的 是 如 果 一 个 数 是 负数 ， 就 应 该 将 它 转 换 
成 反 码 的 形式 。 这 种 转化 结果 的 最 左边 的 二 进 制 位 应 该 是 1， 表明 是 一 个 负数 。 当 然 ， 如 果 一 个 数 是 
正 数 ， 则 无 需 将 其 转换 成 反 码 的 形式 。 所 有 正 数 最 左边 的 位 的 位 置 上 都 应 该 是 一 个 0。 例 2-16 用 来 说 
明 这 些 概 念 。 

例 2-16 利用 8 位 二 进 制 数 的 反 码 形式 表示 2310 和 一 910。 

23io 王 十 〈000101112) 一 00010111s 

一 91o 三 一 〈00001001?) 王 111101102 加 

假设 要 从 23 中 减 去 9。 要 执行 反 码 的 减法 ， 首 先 要 将 减 数 9 表示 成 反 码 的 形式 ， 然 后 骨 与 被 减 数 
23 相 加 ， 这 样 就 得 到 了 一 9 十 23。 最 高 位 会 有 一 个 1 或 者 是 0 的 进位 ， 就 把 它 加 到 和 的 最 低位 。 这 个 过 
程 称 为 高 低 两 端的 进位 循环 (end carry-around) ， 产 生 的 原因 是 使 用 了 反 码 。 

例 2-17 利用 反 码 算术 ， 进 行 十 进 制 数 的 加 法 ，2316 十 (一 910)。 





1—111 11 二 进位 
00010111 (23) 
最 后 的 进位 被 加 二 1 1110110 十 (一 9) . 
到 求 和 结果 中 。 00001101 
.+l 
00001110 1410 | 
例 2-18 使 用 反 码 算术 ， 进 行 十 进 制 数 的 加 法 910 十 (一 2310)。 
最 后 的 进 0<——00001001 (9) 
位 为 0， 求 和 二 1 1101000 十 (一 23) 





计算 完成 。 11110001 —1410 四 
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怎样 知道 求 和 的 结果 11110001。 实际 上 就 是 一 14io 呢 ? 只 需 简单 地 取 这 个 二 进 制 数 的 反 码 〈 记 住 ， 
因为 最 左边 的 位 为 1， 所 以 这 个 数 必 为 负数 )。11110001; 的 反 码 是 00001110: ， 即 为 14。 

反 码 表示 法 的 主要 缺点 是 有 两 种 0 的 表示 法 : 00000000 和 11111111。 由 于 各 种 原因 ， 对 于 二 进 制 
数 ， 计 算 机 工程 师 们 在 很 久 以 前 就 已 经 停止 使 用 了 反 码 表示 法 ， 而 是 采用 一 种 更 有 效 的 补 码 表示 法 。 
补 码 

2 的 补 码 (two’'s complement， 简 称 为 补 码 ) 是 补 码 (radix complement) 体系 的 一 个 特例 。 假 设 
在 基数 为 > 的 计数 体系 中 , 数 N 由 d 位 数字 组 成 。 如 果 N 天 0， 数 N 的 补 码 定 义 为 ri 一 N; 如 果 N= 
0， 数 N 的 补 码 定义 为 0。 通 常 补 码 比 反 码 更 加 直观 。 回 顾 前 面 的 自行 车 里 程 表 的 例子 ， 向 前 行驶 2 英 
里 的 十 进 制 的 补 码 为 103 一 2 一 998， 这 就 是 前 面 所 假设 的 负 〈 向 后 道行 ) 的 距离 。 类 似 地 ， 在 二 进 制 数 
中 ，4 位 数字 00112 的 补 码 为 24 一 0011? = 10000s 一 00112 二 11012。 

仔细 观察 ， 不 难 发 现 补 码 其 实 只 不 过 是 反 码 加 1。 要 求 一 个 二 进 制 数 的 补 码 〈( 称 为 取 补 )， 只 需 简 
单 地 将 二 进 制 数字 的 各 个 位 进行 翻 位 取 反 操作 ， 然 后 再 加 工 即 可 。 这 样 处 理 也 简化 了 加 法 和 减法 运算 。 
因为 减 数 〈 要 取 补 和 相 加 的 数 ) 在 开始 时 就 进行 了 加 1 操作 ， 所 以 在 减法 的 运算 过 程 中 就 不 由 会 有 高 
低 两 端的 进位 循环 问题 。 只 需 简单 地 舍弃 所 有 与 最 高 位 有 关 的 进位 。 需 要 牢记 ， 只 有 负数 才 需 要 转换 
成 补 码 形式 。 

例 2-19 采用 8 位 二 进 制 补 码 形式 表示 十 进 制 数 : 2310 、 一 231o 和 一 9io 。 

2310 二 十 (000101112z) 二 00010111; 

一 2310 二 一 《000101112) 二 11101000z 十 1 二 11101001; 

一 9io 三 一 (000010012) ==11110110z 十 1 二 11110111z 国 

如 果 已 知 一 个 数 的 二 进 制 表示 ， 怎 样 来 求 其 对 应 的 十 进 制 数 呢 ? 对 于 正 数 来 说 ， 这 相当 容易 。 例 
如 ， 要 将 00010111 的 补 码 值 转换 成 十 进 制 数 ， 只 需 简单 地 将 这 个 二 进 制 数 转换 成 十 进 制 数 ， 艺 得 到 
23。 但 是 ， 要 转换 表示 成 补 码 的 负数 ， 却 要 采用 类 似 于 从 十 进 制 数 到 二 进 制 数 转换 的 逆向 操作 过 程 。 
假设 已 知 11110111s 为 补 码 形式 的 二 进 制 数值 ， 求 出 相应 的 十 进 制 数 。 这 是 一 个 负数 ， 并 且 是 用 补 码 
的 形式 表示 的 。 首 先 要 对 该 数字 的 每 一 位 进行 取 反 ， 然 后 加 1( 即 求 出 反 码 再 加 1)。 结 果 如 下 : 
00001000? 十 1 = 00001001? 。 这 个 数值 等 于 十 进 制 数 9。 当 然 ， 因 为 开始 时 这 个 数字 就 是 负数 ， 内 此 
二 进 制 数 11110111z 对 应 的 十 进 制 数 即 为 一 9。 

下 面 的 两 个 例子 表示 的 是 怎样 使 用 补 码 表示 来 进行 加 法 运算 。 当 然 ， 也 包括 减法 运算 ， 内 为 减 去 
一 个 数 等 于 加 上 这 个 数 的 反 数 。 

例 2-20 利用 补 码 算术 ， 计 算 加 法 : 910 十 (一 2310)。 











00001001 (9) 
十 1 1101001 十 (一 23) 
11110010 一 14io | 


这 里 留 给 读者 作为 一 个 练习 去 验证 ， 使 用 补 码 表示 法 的 二 进 制 数 11110010z 实际 上 就 是 一 14360。 
例 2-21 利用 补 码 算术 ， 对 十 进位 制 数 一 9o 和 231o 求 和 。 





1<-111 111 < 进位 
据 弃 00010111 (23) 

进位 十 1 1110111 十 (一 9) 

00001110 14io 


注意 ， 在 例 2-21 中 据 弃 的 进位 不 会 导致 错误 的 结果 。 如 果 是 两 个 正 数 相 加 ， 则 可 能 产生 溢出 ， 结 
果 是 负 值 。 而 两 个 负数 相 加 ， 也 可 能 产生 溢出 ， 结 果 却 是 正 的 。 当 使 用 补 码 表示 法 时 ， 一 个 止 数 和 -… 
个 负数 相 加 是 不 可 能 出 现 溢出 的 。 

利用 简单 的 计算 机 电路 可 以 很 方便 地 检测 出 洲 出 的 条 件 ， 所 采用 的 法 则 也 很 容易 记忆 。 读 者 可 能 
注意 到 ， 在 例 2-21 中 ， 进 和 人 符号 位 的 进位 〈 即 从 符号 位 的 前 一 位 进 到 符号 位 的 一 个 1) 与 移出 符号 位 
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的 进位 ( 艺 移 出 符号 位 并 且 被 气 弃 的 一 个 1) 是 相同 的 。 如 果 这 两 个 进位 相等 ， 表 示 没 有 溢出 发 生 。 
如 果 它 们 不 相等 ， 就 在 算术 逻辑 单元 中 设置 一 个 溢出 指示 ， 指 出 该 结果 不 正确 。 
检测 溢出 条 件 的 一 个 简单 法 则 : 如 果 进 入 符号 位 和 移出 符号 位 的 进位 相等 ， 那 么 没有 溢出 发 
生 。 如 果 不 同 ， 就 有 溢出 发 生 ， 也 就 是 出 现 一 个 错误 。 
难点 在 于 程序 员 (或 编译 器 ) 要 不 断 地 去 校 验 这 个 溢出 条 件 。 例 2-22 就 表示 发 生 了 一 个 溢出 现象 ， 原 
因 是 进入 符号 位 的 进位 (移入 的 是 1) 不 等 于 移出 符号 位 的 进位 (移出 的 是 0) 。 
例 2-22 利用 补 码 算术 ， 对 二 进 制 数 12610 和 81o 求 和 。 


0<-1111 < 二 进位 
据 痉 01111110 (126) 
进位 十 0 0001000 十 (8) 





10000110 (一 122???) 

其 中 ， 一 个 1 进位 到 最 左边 的 位 ， 而 一 个 0 从 最 左边 的 位 移出 来 。 因 为 这 两 个 进位 不 相等 ， 所 以 有 一 
个 溢出 发 生 。 读 者 可 以 很 容易 地 看 到 ， 两 个 正 数 相 加 ， 其 结果 却 是 一 个 负数 。 国 

补 码 是 目前 最 通用 的 带 符号 的 数字 的 表示 方法 。 对 于 加 法 和 减法 来 说 ， 补 码 算法 非常 简单 。 而 
对 于 数值 0 (所 有 的 位 都 是 0) 具有 最 好 的 表示 方法 。 补 码 算法 具有 自 反 特 征 ， 很 容易 扩展 到 较 大 位 
数 的 数值 。 但 是 ， 这 种 补 码 表示 方法 的 最 大 缺点 在 于 ， 由 N 位 二 进 制 数 所 表示 的 数值 的 范围 具有 非 
对 称 性 。 例 如 ， 采 用 符号 幅 值 表示 法 ，4 位 二 进 制 数 可 以 表示 的 数值 范围 是 一 7 到 十 7。 而 采用 补 码 
表示 法 时 ， 却 可 以 表示 从 一 8 到 十 7 之 间 的 数字 。 这 常常 会 使 读者 在 学 习 补 码 表示 法 时 感到 有 些 困 
惑 。 要 理解 为 什么 采用 4 位 补 码 表示 法 所 能 表示 的 最 大 数 为 十 ， 只 要 记 住 央 为 二 进 制 补 码 的 第 一 位 
必须 是 0。 如 果 剩 下 的 位 全 部 都 是 1 〈 可 能 表示 的 最 大 幅 值 ) ， 则 为 0111z ， 这 就 是 7。 读 者 马上 会 联 
想到 最 小 的 一 个 负数 应 该 是 1111? 。 但 是 ， 在 补 码 表示 法 中 ， 二进制 数 1111 实际 上 代表 的 是 一 1 
(对 所 有 的 位 进行 取 反 ， 然 后 加 1， 并 且 肥 负数 )。 然 而 ,怎样 用 4 位 补 码 来 表示 一 8? 二 进 制 数 
10002 就 是 。 大 家 知道 这 是 一 个 负数 。 如 果 将 其 所 有 位 取 反 (为 0111);， 肯 加 1 (得 到 1000， 即 
为 8)， 最 后 取 负 数 ， 即 为 8。 
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除非 使 用 巧妙 的 算法 ， 否 则 乘法 和 除法 都 需要 花费 相当 多 的 计算 周期 才能 得 出 结果 。 这 里 仅仅 讨 
论 这 些 运 算 的 最 直接 的 方法 。 在 实际 的 系统 中 ， 有 专门 设计 的 硬件 用 来 优化 乘法 和 除法 的 计算 过 程 ， 
有 时 是 实现 并 行 计算 。 有 兴趣 的 读者 可 以 参考 本 章 结 尾 所 引证 的 一 些 参考 文献 来 探究 一 下 这 些 先进 的 
计算 方法 。 
| 计算 机 使 用 的 最 简单 的 乘法 运算 与 我 们 用 纸 和 笔 所 进行 的 乘法 运算 相 类 似 。-- 个 完整 的 计算 机 的 
乘法 表 是 再 简单 不 过 的 : 0 乘 以 任何 数 得 0， 而 1 乘 以 任何 数 的 结果 还 是 原来 的 数值 。 

为 了 说 明 这 种 简单 的 计算 机 的 乘法 运算 ， 先 把 乘 数 和 被 乘 数 写 到 了 两 个 不 同 的 存储 空间 中 ， 上 峙 留 出 
第 三 个 空间 位 置 来 存储 乘积 结果 。 从 最 低位 开始 ， 对 乘 数 的 每 一 位 设置 一 个 指示 器 〈 指 针 ) 。 对 应 于 乘 
数 中 的 每 一 位 ， 被 乘 数 都 依次 向 左边 移动 一 位 。 当 乘 数 为 1 时， 被 移 位 的 被 乘 数 就 被 加 到 … 个 部 分 积 
的 连续 求 和 中 。 由 于 是 按照 乘 数 中 的 每 一 位 来 移 位 被 乘 数 ， 因 此 存放 乘积 的 工作 空间 要 求 是 乘 数 或 者 
是 被 乘 数 的 两 倍 。 

对 于 二 进 制 数 的 除法 运算 可 以 用 两 种 简单 的 方法 来 实现 : 或 者 使 用 从 除数 中 连续 替代 减 去 分 母 的 
方法 ， 或 者 采用 我 们 在 小 学 课堂 中 学 过 的 试 算 法 方式 的 长 除法 。 正 如 前 面 所 述 ， 包 括 乘法 在 内 ， 最 有 
效 的 计算 二 进 制 数 除法 的 方法 已 经 超出 了 本 书 的 范围 ， 读 者 可 以 在 本 章 结尾 的 参考 资料 中 获取 有 关 
信息 。 

不 论 所 使 用 的 各 种 算法 的 相对 效率 如 何 ， 除 法 都 是 一 种 可 能 引起 计算 机 系统 发 生 骨 省 的 运算 。 特 
别 是 在 尝试 除 以 0 或 者 是 出 现 两 个 操作 数 的 大 小 相差 极为 悬殊 的 情形 。 当 除数 远 小 于 被 除数 时 ， 就 会 
产生 一 种 “除法 下 浇 《divide underfiow)”, 的 情况 ， 也 就 是 计算 机 视 为 等 效 被 0 除 ， 这 种 计算 过 程 是 不 
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可 能 实现 的 。 

计算 机 的 整数 除法 和 浮 点 除法 之 间 有 显著 的 区 别 。 对 于 整数 除法 ， 其 结果 由 两 部 分 组 成 : 商 和 余 
数 。 而 浮 点 除法 的 结果 则 表示 为 一 个 二 进 制 的 分 数 的 形式 。 由 于 这 两 类 除法 的 运算 过 程 差异 非常 大 ， 
所 以 需要 各 自 使 用 专门 的 电子 线路 来 分 别 实现 这 两 种 不 同 除法 运算 。 浮 点 计算 采用 的 是 专门 设计 的 所 
谓 浮 点 单元 (floating-point units，FPU) 的 部 件 来 实现 的 。 

例 ” 求 00000110。 和 00001011s 的 积 。 


被 乘 数 部 分 积 
[oToToToToTiTi1o] + [olololoToToToIo 101 人 加 补 乘 数 并 
1y 一 4 
[oToloToTi T1010] + [Oo 10 人 加 繁 于 数 并 
Dy 
[OooTUooo + [Oo 1 2 


en 
[ololiTiToTololo] + [olololliolob lol i 1 1 加 被 乘 数 


= [olloloflololilo] 乘积 结果 
国 


“2.5 浮 点 表示 法 


在 构建 实际 的 计算 机 系统 时 ， 可 以 采用 前 面 刚刚 介绍 的 任何 一 种 整数 表示 方法 。 下 面 将 选取 其 中 
一 种 表示 方法 来 实现 计算 机 系统 的 设计 任务 。 接 下 来 工作 就 是 决定 计算 机 系统 的 字 长 。 如 果 和 希望 设计 
的 系统 不 是 太 贵 的 话 ， 就 选择 较 小 的 字 长 ， 例 如 16 位 。 在 设置 了 一 个 符号 位 后 ， 系 统 可 以 存储 的 最 大 
整数 是 32767。 下 面 要 做 的 工作 就 是 设法 使 设计 的 系统 满足 一 个 潜在 顾客 的 需求 : 要 对 本 年 度 购 票 进 
场 观 看 专业 体育 比赛 的 观众 人 数 进行 登记 。 毫 无 疑问 ， 这 个 数目 会 大 于 32767。 当 然 ， 只 需要 将 计算 
机 系统 的 字 长 的 位 再 扩大 一 些 ， 比 如 说 32 位 ， 这 个 问题 就 可 以 解决 。 现 在 设计 的 计算 机 的 字 长 已 经 足 
以 应 对 人 们 所 面临 的 各 种 计数 问题 ， 但 是 如 果 这 个 顾客 想 知道 每 个 观众 在 娱乐 时 间 内 每 分 钟 所 消费 的 
金额 数目 ， 这 个 数目 可 能 是 一 个 小 数 。 这 时 计算 机 又 该 怎么 做 呢 ? 

最 简单 和 最 节约 的 办 法 是 维持 采用 16 位 的 计算 机 系统 ， 并 且 对 自己 说 “ 嗨 ， 这 里 只 是 设计 一 个 廉 
价 的 计算 机 系统 。 要 想 用 它 来 完成 一 些 神奇 的 工作 ， 做 一 个 好 的 程序 设计 员 不 就 行 了 ”。 尽 管 这 种 说 法 
从 现代 技术 的 角度 听 起 来 有 点 过 于 轻率 ， 但 它 却 是 计算 机 早期 发 展 年 代 的 真实 情况 。 早 期 的 微 处 理 器 
或 计算 机 主机 都 没有 浮 点 运算 单元 。 事 实 上 ， 好 多 年 来 ， 都 是 通过 精巧 的 编程 来 使 得 当时 的 那些 整数 
机 器 系统 能 够 像 浮 点 机 器 一 样 来 实现 浮 点 运算 。 

如 果 熟 悉 科 学 计数 法 的 话 ， 就 会 联想 到 怎样 来 处 理 浮 点 运算 问题 ， 即 在 一 个 整数 机 的 系统 中 实现 
所 谓 浮 点 仿真 (floating-point emulation) 。 在 科学 计数 法 中 ， 数 字 被 表示 成 两 部 分 : 小 数 部 分 ， 称 为 尾 
数 (mantissa) ， 和 一 个 指数 部 分 ， 写 成 10 的 宕 指数 形式 。 这 两 部 分 的 乘积 就 代表 了 要 表示 的 数 。 例 
如 ， 在 科学 计数 法 的 表示 中 ，32767 就 写成 了 3. 2726X 104 。 科 学 计数 法 可 以 简化 一 些 涉及 到 很 大 的 数 
字 或 很 小 的 数字 的 计算 过 程 。 同 时 ， 科 学 计数 法 也 是 现代 数字 计算 机 中 浮 点 计算 法 的 基础 。 


2.5.1 一 个 简单 的 模型 


在 数字 计算 机 系统 中 ， 浮 点 数字 由 三 部 分 组 成 : 符号 位 、 指 数 部 分 按照 2 的 震 指 数 形式 表示 ) 
和 小 数 部 分 ， 称 为 有 效 数 (significand， 这 是 关于 尾数 > 
一 词 的 另 一 种 表述 )。 指 数 部 分 和 有 效 数 部 分 所 使 用 的 ” 符 位 ”指数 ， 有 效 数 
位 数 取 决 于 对 数值 表示 范围 (范围 越 大 ， 使 用 的 指数 lh 
位 数 越 多 ) 和 精度 精度 越 高 ， 需 要 的 有 效 数 的 位 数 因 2 2 玫 六 和 不光 
就 越 多 ) 的 要 求 。 在 本 节 的 后 面部 分 ， 我们 将 使 用 一 个 14 位 模型 。 其 中 ,5 位 指数 ，8 位 有 效 数 和 1 
位 符号 (参见 图 2.2) 。 更 加 通用 的 表示 形式 将 在 第 2. 5. 2 节 中 介绍 。 

候 设 要 在 模型 中 存储 一 个 十 进 制 数 17。 大 家 知道 ，17=17.0X109==1.7X101==0.17X10?。 类 似 
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地 ， 在 二 进 制 体系 中 ，1710 二 100012 X29 二 1000. 12 X21=100.012 X22 二 10. 0012 X23=1.0001z X21 二 
0. 100012 X 25 。 如 果 采 用 最 后 面 的 形式 ， 小 数 部 分 是 10001000， 而 指数 部 分 是 00101， 如 下 所 示 。 











采用 这 种 形式 ， 可 以 存储 的 数 要 比 采用 14 位 定点 (fixed-point〉 表示 法 (需要 总 共 使 用 了 14 位 二 
进 制 数字 ， 加 上 一 个 二 进 制 小 数 点 ， 或 者 简称 小 数 点 ) 所 能 表示 数 大 得 多 。 在 这 一 模型 中 ，65536 = 
0. 12 X217 表示 为 : 





四 IER 1 0 0 0 0 0 0 0 








这 个 模型 存在 的 一 个 明显 问题 是 没有 负 指 数 的 表示 。 如 果 要 存储 分 数 0. 25， 就 无 法 完成 。 原 因 是 0. 25 
是 2-?， 指数 部 分 为 一 2， 无 法 在 这 个 模型 中 表示 。 显 然 ， 可 以 通过 在 指数 部 分 增加 符号 位 的 方法 来 解 
决 这 个 问题 。 但 是 ， 通 常 更 有 效 的 做 法 是 使 用 偏 移 〈biased) 指数 ， 这 样 在 比较 两 个 浮 点 数 的 数值 时 ， 
可 以 采用 比较 简单 的 整数 电路 。 

使 用 偏 移 指数 的 思想 就 是 要 在 允许 的 范围 内 将 每 一 个 整数 都 转化 成 一 个 非 负 整数 ， 这 样 就 可 以 把 
每 个 整数 都 作为 一 个 二 进 制 数 来 存储 。 在 指数 允许 的 表示 范围 之 内 ， 首 先 要 通过 在 每 个 指数 上 加 一 个 
固定 偏 移 值 的 方法 来 对 整数 加 以 调整 。 一 般 取 偏 移 值 为 靠近 指数 可 能 取 值 范围 中 间 的 某 个 值 ， 并 且 选 
择 偏 移 值 来 表示 0。 例 如 在 本 例 中 ， 可 以 选择 16 作为 偏 移 值 ， 因 为 16 位 于 0 和 31 的 中 间 (这 里 指数 
部 分 占 5 位， 允许 的 值 为 2， 或 32)。 任 何 大 于 16 的 指数 将 表示 为 一 个 正 值 ， 而 小 于 16 的 指数 表示 
为 一 个 负 值 。 这 种 方法 被 称 为 16 - 余 (excess-16) 表示 法 ， 因 为 需要 减 去 16 才能 得 到 真正 的 指数 值 。 
要 注意 的 是 ， 通 常情 况 下 全 部 为 0 和 全 部 为 1 的 指数 是 为 某 些 特定 的 数 所 保留 的 〈 例 如 0 或 者 是 无 限 
大 )。 但 在 本 例 中 ， 人 允许 全 部 为 0 和 全 部 为 1 的 指数 出 现 。 

现在 回 到 前 面 存储 数字 17 的 例子 ， 计算 1716 = 二 0. 100012 X 25 ， 偏 移 指 数 即 为 16 十 5 二 21; 


0l1 0 1 0 1 | 1 0 0 0 1 0 0 o | 


如 果 要 存储 0.25=0.1X2-1， 则 为 如 下 的 表示 ， 


1o0lo 1 1 1|1 0006000 00| 


这 种 数据 体系 仍然 存在 一 个 相当 大 的 问题 ， 即 对 每 个 数 的 表示 方法 并 不 是 唯一 的 。 下面 的 表示 都 
是 等 效 的 : 




















ol10101|10001000|= 
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内 为 这 一 类 的 对 称 的 表示 形式 不 能 很 好 地 适用 于 数字 计算 机 系统 ， 所 以 大 家 接受 了 这 样 一 种 惯例 ， 
就 是 将 有 效 数 的 最 左边 的 位 总 是 设置 为 1。 这 种 惯例 称 为 规格 化 〈normalization) 。 这 种 惯例 做 法 还 有 
一 个 好 处 就 是 ， 这 个 最 左边 的 1 对 于 有 效 数 给 出 了 一 位 额外 的 精度 。 

例 2-23 利用 带 16- 余 偏 移 指数 的 规格 化 浮 点 表示 十 进 制 数 0. 03125lo 。 

0.0312510 二 0. 000012 X29 二 0. 0001 X27-1 二 0. 001 X27? 二 0.01X2-3 二 0. 1X2-4。 应 用 偏 移 值 ， 指 
数 部 分 为 16 一 4 二 12。 








0|0 1 1 0 0 | 1 0 0 0 0 0 0 0 





本 例 中 并 没有 使 用 归 范 化 表示 法 来 表示 这 个 数字 ， 寺 为 它 已 经 包含 了 1 在 内 。 LJ 
2.5.2 浮 点 算法 


大 家 知道 ， 要 对 两 个 用 科学 计数 法 表示 的 十 进 制 数 进 行 加 法 运算 ， 例 如 1.5X102 十 3.5X103， 首 
先 要 将 这 两 个 数 表示 成 具有 同一 基数 的 相同 指数 形式 ， 然 后 才能 将 小 数 部 分 相 加 。 即 ，1.5X102 十 3.5 
X103= 一 0.15X103 十 3.5X103 一 3. 65X103 。 浮 点 加 法 和 减法 的 原理 与 此 相同 ， 说 明 如 下 。 

例 2-24 对 下 面 两 个 利用 带 16 - 余 伪 移 指数 的 规格 化 浮 点 形式 表示 的 二 进 制 数 进行 加 法 运算 。 














不 难 发 现 ， 加 数 比 被 加 数 要 高 两 阶 指 数 ， 利 用 二 进 制 小 数 点 移 位 可 以 将 这 两 个 数 对 齐 : 
11. 001000 

十 0. 10011010 

11. 10111010 


重新 进行 规格 化 处 理 ， 保 留 那个 较 大 的 指数 ， 并 删除 有 效 数 的 低位 ， 得 到 : 





[oli1 oo 1 0f: 11011 10| 国 





乘法 和 除法 采用 与 十 进 制 算 法 中 的 指数 运算 的 相同 法 则 进行 ， 例 如 ,地 3X24 一 21。 
例 2-25 乘法 


0|1 0 0 1 0 1 1 0 0 1 0 0 0 | =0. 11001000x 2: 


XxX 0 | 1 0 0 0 of i 0 0 1 1} 0 1 0|=0.100110i0x2° 




















0. 11001000 乘 以 0.10011010 的 积 为 0.0111100001010000， 然 后 乘 以 2 Xx 29 = 22 得 到 
1. 1110000101。 重 新 进行 规格 化 ， 留 取 合 适 的 指数 ， 得 到 的 浮 点 积 为 : 





lof1 oo00 1|1 :1110000 [| 





2.5.3 浮 点 误差 
当 我 们 用 笔 和 纸 求解 三 角 代 数 问题 和 计算 一 个 投资 的 贺 报 利率 时 ， 很 明显 使 用 的 是 实数 体系 。 实 
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数 体系 是 一 个 无 限 区 间 ， 因 为 对 于 任意 给 定 的 一 对 实数 ， 都 可 以 找到 另外 一 个 实数 位 于 这 两 个 实数 
之 间 。 

与 人 们 想像 中 的 数学 不 同 ， 计 算 机 是 一 个 有 限 的 系统 ， 其 存储 能 力也 是 有 限 的 。 在 运用 计算 机 进 
行 浮 点 运算 时 ， 就 是 在 运用 一 个 有 限 的 整数 系统 对 无 限 的 实数 系统 行 建 模 。 所 做 的 一 切 事 实 上 只 是 实 
数 系统 的 一 个 近似 (approximation) 。 使 用 的 位 数 越 多 ， 这 种 近似 就 越 好 。 但 是 ， 不管 计算 机 使 用 多 少 
位 数 ， 总 是 会 存在 一 些 误差 。 

浮 点 误差 可 能 是 明显 的 ， 也 可 能 是 细微 的 ， 或 者 是 不 被 人 们 所 注意 的 。 明 显 的 误差 ， 比 如 ， 数 的 
上 溢 或 下 洲 是 一 些 可 能 造成 程序 崩溃 的 大 的 误差 。 而 一 些 细微 的 误差 ， 常常 会 产生 一 些 错 误 的 结果 ， 
并 且 在 发 生 问 题 之 前 一 般 很 难 检 查 出 来 。 例 如 ， 在 上 面 的 简单 模型 中 ， 我 们 可 以 表示 从 一 0.11111111 
X25 到 十 0. 11111111z X21 之 间 范 围 内 的 规格 化 数值 。 很 明显 ， 这 个 模型 不 能 储存 2- ,或 是 2218， 
因为 它们 根本 不 在 允许 的 范围 内 。 但 是 ， 这 个 模型 不 能 精确 地 存储 数值 128. 5 这 一 事实 却 不 是 那么 明 
显 ， 内 为 这 个 数 就 在 模型 适用 的 范围 之 内 。 如 果 把 128. 5 转换 成 二 进 制 数 ， 就 是 10000000. 1， 数 值 的 
长 度 有 9 位 数字 。 模 型 中 的 有 效 数 的 位 数 只 有 8 位 。 通 常 ， 低 位 的 数字 会 被 丢弃 ,或 者 舍 人 到 相 邻 的 
高 位 。 然 而 ， 不 管 怎样 来 处 理 这 个 问题 ， 都 已 经 在 系统 中 引 人 了 误差 。 

可 以 通过 求 误差 的 绝对 值 和 数字 的 真实 值 的 比例 ， 来 计算 所 采用 的 表示 方法 的 相对 误差 。 对 于 
128. 5 的 例子 ， 有 : 

128.5 一 128 
128.5 

如 果 不 仔 细 处 理 的 话 ， 这 个 误差 会 在 某 些 长 串 的 计算 过 程 中 不 断 传 递 下 去 ， 造 成 计算 精度 上 的 重大 误 
差 。 图 2-3 显示 了 这 样 一 个 误差 的 传递 过 程 ， 图 中 使 用 了 14 位 模型 进行 16. 24 乘 以 0. 91 的 多 次 迁 代 运 
算 。 将 这 些 数 转换 成 二 进 制 数 时 ， 开 始 就 可 以 看 到 存在 明显 的 误差 。 


一 0.00389105<“0. 39% 





乘 数 被 乘 数 14 位 乘积 真实 乘积 





1000.001 0.11101000 = 1110.1001 
(16.125) (0.90625) (14.5625) 14.7784 


1110.1001 0.11101000 = 1101.0011 
(14.5625) (13.1885) 13.4483 1.94% 


1101.0011 0.11101000 = 1011.1411 
(13.1885) (11.9375) 12.2380 2.46% 


1011.1111 0.11101000 = 1010.110] 
(11.9375) (10.8125) 11.1366 


1010.1101 0.11101000 = 1001.1100 
(10.8125) (9.75) 10.1343 


1001.1100 0.11101000 = 1000.1101 
(9.75) (8.8125) 





图 2-3 ”14 位 浮 点 数字 中 的 误差 传递 
经 过 6 次 乘法 选 代 运算 后 ， 乘 积 的 误差 已 经 增 大 到 三 倍 。 继 续 不 断 地 迭代 运算 下 去 ， 最 终 会 产生 
100% 的 误差 ， 因 为 乘积 的 结果 最 后 等 于 0。 尽 管 14 位 模型 太 小 ， 以 至 于 误差 被 夸大 了 ， 但 是 所 有 的 浮 
点 系统 的 工作 方式 都 是 相同 的 。 不 管 把 系统 设计 得 有 多 么 大 ， 利 用 一 个 有 限 的 系统 来 表示 一 个 实数 ， 
或 多 或 少 会 引入 不 同 程度 的 浮 点 误差 。 即 使 是 最 小 的 误差 ， 也 会 导致 灾难 性 的 后 果 ， 尤 其 是 使 用 计算 
机 对 一 些 物理 事件 进行 控制 时 ， 例 如 在 军事 和 医疗 技术 的 应 用 中 。 计 算 机 科学 家 所 面临 的 一 大 挑战 就 
是 寻找 最 有 效 的 算法 ; 把 这 些 误差 控制 在 性 能 和 经 济 允 许 的 范围 内 。 
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2.5.4 IEEE-745 浮 点 标准 


前 面 引 入 浮 点 模型 的 意义 在 于 简化 问题 和 便于 理解 浮 点 的 概念 。 现 在 可 以 把 这 个 模型 推广 到 所 需 
的 任意 位 数 的 数字 。 直 到 上 个 世纪 80 年 代 以 前 ， 有 关 这 方面 的 的 工作 还 只 是 处 于 随意 和 杂乱 的 状态 ， 
没有 统一 的 标准 ， 这 导致 了 不 同 制造 商 的 系统 存在 着 许 许多 多 不 兼容 的 表示 方法 。1985 年 ， 电 子 与 电 
气 工 程 师 协会 (IEEE) 发 表 了 一 份 有 关 单 精度 和 双 精 度 浮 点 数 的 浮 点 表示 标准 。 这 个 标准 官方 称 为 
IEEE-754 (1985) 。 

IEEE-754 单 精 度 标 准 采用 8 位 指数 ， 一 个 127 余 的 偏 移 值 和 23 位 的 有 效 数 。 包 括 一 个 符号 位 ， 
单 精度 泽 点 数 的 总 字 长 为 32 位 。 当 指数 等 于 255 时 ， 表 示 的 量 是 土 无 穷 大 (有 限 位 数 是 0) 或 者 “ 非 
数 ”( 具 有 非 0 的 有 效 位 ，)。“ 非 数 ” 或 NaN， 用 来 表示 一 个 非 实数 的 值 ， 并 且 通 常用 做 一 个 错误 指示 。 

双 精 度数 字 采 用 带 符号 的 64 位 字 ， 其 中 11 位 指数 和 52 位 有 效 数字 。 偏 移 值 是 1023。IEEE 双 精 
度 模 型 可 以 表示 的 数字 范围 如 图 2-4 所 示 。 当 指数 为 2047 时 ， 表 示 NaN。 


0 






可 表示 的 负数 正 数 溢出 







可 表示 的 正 数 


一 1.0x 10% 一 1.0x 10 *%w LOXx 10 ?2 1 OX 10%s 
图 2-4 IEEE-754 双 精 度 浮 点 数 表示 的 范围 

从 性 能 的 角度 考虑 ， 由 于 增加 的 成 本 不 多 ， 所 以 大 多 数 的 FPU 都 只 是 使 用 64 位 模型 。 册 此 ， 只 
需 设 计 一 组 特殊 的 电路 来 实现 双 精 度 模 型 的 运算 。 

无 论 是 单 精度 还 是 双 精 度 IEEE-754 模型 都 有 两 种 表示 0 的 方法 。 当 指数 和 有 效 数 全 部 为 0 时， 所 
存储 的 数量 就 是 0。 这 时 候 ， 符 号 位 中 存储 的 是 什么 数字 无 关 紧 要 。 因 此 ， 程 序 设 计 人 员 在 对 一 个 浮 
点 值 和 0 进行 比较 时 ， 就 需要 特别 的 小 心 。 

事实 上 ， 近 来 设计 的 每 一 种 计算 机 系统 都 采用 IEEE-754 的 浮 点 模型 。 不 幸 的 是 ,在 该 标准 公布 以 
前 ， 许 多 主流 计算 机 系统 都 建立 了 它们 自己 的 浮 点 体系 。 对 于 比 较 成 熟 的 计算 机 体系 结构 ， 例 如 IBM 
主流 机 型 ， 差 不 多 花 了 十 几 年 时 间 来 适应 这 种 新 的 浮 点 体系 。 现 在 ， 这 些 系统 既 支 持 传统 的 浮 点 体系 ， 
也 支持 IEEE-754 体系 。 但 是 ，1998 年 以 前 ，IBM 的 计算 机 系统 一 直 都 采用 与 源 自 于 1964 年 最 初 在 
System/360 中 所 使 用 的 浮 点 算术 完全 相同 的 体系 结构 。 由 于 大 量 老 的 软件 仍然 在 使 用 ， 所 以 人 们 希望 
新 的 计算 机 系统 能 够 继续 支持 两 种 浮 点 体系 。 


2.6 字符 编码 


数字 计算 机 使 用 二 进 制 体系 来 表示 和 处 理 数字 值 。 现 在 要 考虑 怎样 可 以 将 这 些 计 算 机 内 部 使 用 的 
数值 转换 成 人 们 所 能 理解 的 形式 。 这 种 转换 方式 既 取 决 于 计算 机 使 用 的 编码 系统 ， 也 和 这 些 数值 的 存 
取 方 式 有 关 。 


2.6.1 二 进 制 编码 的 十 进 制 数 


二 进 制 编码 的 十 进 制 数 (binary-coded decimal，BCD) 是 最 初 在 IBM 主流 机 型 和 中 间 过 渡 机 型 上 
使 用 的 数字 编码 系统 。BCD 是 将 每 个 十 进 制 数字 编码 成 一 个 4 位 的 二 进 制 数 形式 。 如 果 按 照 8 位 字 节 
的 形式 进行 存储 时 ， 其 中 的 高 4 位 称 为 区 位 (zone)， 而 低 4 位 称 为 数字 (digit)。 .这 种 转换 方式 来 源 于 
穿孔 卡片 年 代 的 思想 ， 在 穿孔 卡片 每 一 列 的 最 上 面 2 行 的 某 一 行 中 有 一 个 “区 位 穿孔 ”， 而 在 最 下 面 的 
10 行 的 某 一 行 中 有 一 个 “数字 穿孔 ”。BCD 字 节 的 高 4 位 表示 符号 ， 使 用 了 其 中 的 3 个 数值 : 1111 表 


计算 机 系统 中 的 数据 表示 方法 41 








示 无 符号 数 ，1100 表示 正 数 ， 而 1101 则 表示 负数 。 ea es sis ease 

从 图 中 可 以 看 出 , 还 有 6 个 二 进 制 数值 编码 没有 被 使 用 ， 从 
1010 到 1111。 虽 然 看 起 来 几乎 有 40% 的 资源 被 浪费 ， 但 是 在 表示 
精度 方面 却 得 到 了 很 大 的 提高 。 例 如 ， 十 进 制 数 0. 3 在 存储 为 二 
进 制 数 时 是 一 个 循环 小 数 。 存 储 时 需要 截取 成 一 个 8 位 小 数 ， 如 
果 青 从 二 进 制 数 转换 回 十 进 制 数 却 为 0. 296875， 结 果 造 成 了 一 个 
近似 为 1.05% 的 误差 。 而 在 BCD 编码 系统 中 ， 十 进 制 数 0. 3 直接 
的 存储 为 1111 0011 (这 里 假定 了 数据 格式 中 隐 含 有 小 数 点 ) ， 根 
本 就 没有 误差 。 

因为 BCD 编码 数 的 数字 只 占 一 个 4 位 的 半 字 节 ， 所 以 在 将 多 
个 相连 的 数字 放 和 人 相 邻 的 半 字 节 时 ， 只 需 留 下 一 个 4 位 的 半 字 节 
给 的 符号 。 这 样 可 以 简化 计算 ， 并 且 可 以 节省 空间 。 这 个 过 程 称 
为 压缩 (packing)， 按 照 这 种 方式 存储 的 十 进 制 数 称 为 压缩 的 十 ”图 2-5 二 进 制 编码 的 十 进 制 数 
进 制 数字 (packed decimal number) 。 

例 2-26 利用 压缩 的 BCD 编码 在 3 个 字 节 中 表示 一 1265。 

1265 的 区 位 -数字 编码 形式 为 : 

1111 0001 1111 0010 1111 0110 1111 0101 

压缩 后 ， 这 串 字符 变 成 ， 

0001 0010 0110 0101 

在 低位 数字 后 面 加 上 符号 ， 在 3 个 字 节 的 高 位 补足 1， 则 有 : 


0000 oool | 0010 0110 0101 1101 国 


在 开发 IBM System/360 之 前 ，IBM 公司 一 直 使 用 6 位 BCD 编码 的 变化 形式 来 表示 字符 和 数字 。 
但 是 ， 这 种 编码 方式 在 怎样 表示 和 处 理 数 据 方面 受到 很 大 的 限制 。 事 实 上 ， 小 写字 母 不 能 用 作 当 时 
IBM 机 器 指令 系统 的 一 部 分 。 当 时 ，System/360 的 设计 者 们 需要 有 更 大 的 信息 处 理 能 力 以 及 一 种 能 够 
同时 存储 数字 和 数据 的 统一 方法 。 为 了 保证 与 以 前 的 计算 机 系统 及 其 外 围 设备 具有 兼容 性 ，IBM 公司 
的 工程 师 们 决定 最 好 的 方法 是 直接 将 BCD 编码 从 6 位 扩展 到 8 位 。 因 此 ， 这 种 新 的 编码 方式 称 为 扩展 
的 二 -十 进 制 编码 的 交换 代码 (Extended Binary Coded Decimal Interchange Code, EBCDIC). IBM 公 
司 继续 在 其 主流 计算 机 和 过 渡 机 型 中 使 用 EBCDIC 编码 。 图 2-6 按照 区 位 -数字 的 形式 给 出 了 EBCDIC 
代码 。 字 符 表 示 采 用 在 区 位 后 面 添加 数字 位 的 方法 。 例如， 在 EBCDIC 代码 表示 中 ;字符 a 是 1000 
0001， 数 字 3 为 1111 0011。 大 写字 母 和 小 写字 母 的 区 别 仅 仅 在 于 第 2 位 不 同 。 这 里 ， 只 需 简单 地 进行 
1 位 数字 的 翻 位 , “ 即 可 实现 大 小 写字 母 之 间 的 转换 。 这 种 区 位 编码 形式 也 同样 使 得 程序 员 很 容易 测试 
输入 数据 的 正确 性 。 


2.6.3 ASOII 


当 IBM 公司 忙于 建造 自己 共有 创新 思想 的 System/360 时 ， 其 他 设备 制造 商 们 却 正在 努力 设计 系 
统 之 间 传 输 数 据 的 各 种 更 好 的 方式 。 美 国信 息 交 换 标准 代码 (American Standard Code for Information 
Interchang，ASCIID 就 是 其 中 之 一 。 ASCII 是 从 使 用 了 几 十 年 的 电 传 打字 (telex) 设备 的 编码 方案 中 
直接 衍生 出 来 的 。 这 些 电 传 设备 使 用 5 位 摩尔 编码 。 这 是 19 世纪 80 年 代 发 明 的 ， 起 源 于 波 特 (Bau- 
dot) 码 的 编码 方式 。 到 了 20 世纪 60 年 代 ， 这 种 5 位 编码 方式 的 局 限 性 已 经 变 得 非常 明显 。 国际 标准 
化 组 织 〈ISO) 就 设计 了 一 种 7 位 的 编码 方案 ， 称 为 第 5 种 国际 字母 。1967 年 ， 这 种 字母 表 成 为 官方 
标准 ， 就 是 我 们 现在 所 称 的 ASCI 和 码 。 














2.6.2 EBCDIC 
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图 2-6 EBCDIC 编码 〈 图 中 的 数值 采用 的 是 二 进 制 区 位 -数字 的 形式 ) 

从 图 2-7 中 可 以 看 出 ASCII 代码 定义 了 32 个 控制 字符 ，10 个 数字 ，52 个 英文 字母 (大 写 和 小 写字 
母 )，32 个 的 特殊 字符 《例如 ，$ 和 #)， 以 及 空格 符号 。 最 高 位 〈 第 8 位 ， 准 预 留用 做 奇偶 校 验 位 。 

奇偶 校 验 (parity) 在 错误 检测 方案 中 是 最 基本 的 方法 。 对 于 类 似 在 电 传 打 字 这 样 简单 的 设备 中 都 
可 以 很 方便 地 执行 奇偶 校 验 。 奇 偶 校 验 位 的 “ 开 ” 和 “ 关 ” 取 决 于 字 节 中 其 他 各 位 的 和 是 偶数 还 是 奇 
数 。 例 如 ， 如 果 采 用 偶数 奇偶 校 验 ， 在 传送 ASCIL 字符 A 时, 低 7 位 就 是 100 0001。 肉 为 这 些 位 的 和 
是 偶数 ， 奇 偶 校 验 位 将 被 设置 为 关 ， 传送 的 数据 就 是 0100 0001。 类 似 地 ， 在 传送 ASCIL 字符 C， 
100 0011， 奇 偶 校 验 位 在 传送 8 位 字 节 前 将 会 被 设置 为 开 ， 即 1100 0011。 奇 偶 校 验 只 能 用 来 检测 一 些 
单位 (single-bit) 的 错误 ， 第 2. 8 节 将 会 讨论 一 些 更 高 级 的 错误 检测 方法 。 

考虑 到 与 通信 设备 的 兼容 性 问题 ， 计 算 机 制造 商 更 倾向 于 使 用 ASCI 代码 。 然 而 ， 跑 着 计算 机 硬 
件 的 性 能 变 得 越 来 越 可靠 ， 对 奇偶 校 验 位 的 需求 开始 减弱 。 在 20 世纪 80 年 代 ， 微 型 计算 机 和 外 围 设 
备 的 制造 商 开 始 利用 奇偶 校 验 位 来 为 12810 和 25510 之 间 的 数值 提供 一 个 “扩展 的 ”字符 集 。 

根据 不 同 的 设备 制造 商 ， 这 些 具有 较 高 效 值 的 字符 可 以 是 从 数学 符号 到 特殊 的 外 庄 字 符 ， 如 五 。 
不 过 ， 这 些 努力 并 未 能 使 ASCII 成 为 一 种 真正 的 国际 交换 代码 。 


2.6.4 统一 字符 编码 标准 
无 论 是 EBCDIC 码 ， 还 是 ASCII 码 ， 都 是 建立 在 拉丁 语系 字母 的 基础 上 的 。 因 此 ， 这 些 编码 方式 
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图 2-7 ASCII 代码 〈 图 中 的 数值 采用 十 进 制 数字 的 形式 ) 


在 对 非 拉丁 字母 提供 数据 表示 的 能 力 方面 受到 了 很 大 限制 ， 


全 世界 所 有 的 国家 都 在 开始 使 用 计算 机 ， 
编码 。 然 而 ， 这 些 编码 都 不 能 与 其 他 国家 的 编码 
相互 兼容 ， 这 样 也 就 在 融入 全球 经 济 的 道路 上 设 
置 了 另 一 种 障碍 。 

为 了 防止 这 种 情况 继续 恶化 ，1991 年 成 立 了 
一 个 由 工业 和 社会 领导 人 组 成 的 协会 ， 并 建立 了 
一 种 新 的 国际 信息 交换 代码 ， 称 为 统一 字符 编码 
(unicode)。 这 个 组 织 也 被 恰当 地 命名 为 统一 字符 
编码 协会 。 

统一 字符 编码 是 一 个 16 位 编码 的 字母 表 ， 
可 以 向 下 兼容 ASCI 码 和 拉丁 -1 字符 集 ， 并 且 与 
ISO/IEC 10646-1 国际 字母 表 相 一 致 。 因 为 统一 
字符 编码 的 基础 是 16 位 编码 ， 所 以 能 够 对 全 世 
界 所 使 用 的 每 一 种 语言 的 大 多 数字 符 进 行 编码 。 
如 果 这 16 位 编码 仍 不 够 用 ， 统 一 字符 编码 还 定 


而 全 球 大 多 数 人 都 使 用 非 拉 丁 语系 。 随 着 


每 个 国家 都 在 设计 出 一 套 能 够 最 有 效 地 表示 自己 本 国语 言 
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图 2-8 统一 字符 编码 的 编码 空间 分 配 
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义 了 一 种 扩展 机 制 ， 允 许 人 们 再 对 100 万 个 额外 的 字符 进行 编码 。 这 样 ， 统 一 字符 编码 足以 对 人 类 文 
明 发 展 历史 上 已 有 的 每 一 种 书写 语言 进行 编码 。 

统一 字符 编码 的 编码 空间 由 五 部 分 组 成 ， 如 图 2-8 所 示 。 一 个 统一 字符 编码 的 完整 体系 还 允许 对 
各 个 单一 字符 的 编码 进行 重新 组 合 ， 以 构成 一 些 复合 字符 。 例 如 ， 由 字符 ““ ”和 “A” 组 合成 字符 
“A”。 这 些 组 合 字符 所 使 用 的 算法 ， 以 及 统一 字符 编码 的 扩展 ， 可 以 查阅 本 章 结尾 处 的 参考 文献 。 

虽然 统一 字符 编码 目前 已 成 为 美式 计算 机 系统 唯一 使 用 的 字符 编码 ， 但 是 大 多 数 计算 机 制造 商都 
在 他 们 的 系统 中 至 少 包含 对 统一 字符 编码 的 某 种 有 限 程度 的 支持 。 统 一 字符 编码 目前 是 Java 编程 请 言 
的 软 认 字符 。 最 终 ， 统 一 字符 编码 能 否 会 被 所 有 计算 机 制造 商 所 接受 ， 还 要 取决 于 他 们 定位 其 产品 市 
场 国际 化 的 需求 程度 ， 以 及 生产 出 某 种 具有 支持 存储 ASCII 码 和 EBCDIC 编码 字符 双重 需求 的 磁盘 驱 
动 器 的 成 本 价格 。 


2.7 用 于 数据 记录 和 传递 的 编码 方式 


ASCH 码 、EBCDIC 码 和 统一 字符 编码 都 是 在 计算 机 存储 器 中 使 用 的 各 种 明确 的 表示 方法 
(第 3 章 将 介绍 怎样 使 用 二 进 制 数字 设备 来 实现 这 种 表示 )。 数 字 开 关 ， 例 如 在 存储 器 中 使 用 的 开关 ， 
除了 “ 开 ” 和 “ 关 ” 两 种 状态 外 ， 不 存在 任何 中 间 状 态 。 然 而 ， 在 把 数据 写 人 到 某 种 类 型 的 记录 介质 
(例如 ， 磁 带 或 者 磁盘 ) ， 或 者 将 数据 进行 长 距离 传送 时 ， 二 进 制 数 信号 可 能 会 变 得 模糊 不 清 ， 特 别 是 
当 信号 中 有 一 长 串 1 和 0 时。 造成 这 种 模糊 不 清 的 原 内 ， 其 中 一 部 分 要 归 答 于 信号 发 送 和 信号 接收 之 
间 定 时 系统 出 现 的 偏差 。 而 磁 记 录 介 质 ， 如 磁带 和 磁盘 等 ， 同 样 会 因为 其 制 成 的 磁 材 料 本 身 的 电学 行 
为 而 导致 记录 信和 号 的 不 同步 。 数 字 信号 的 “高 ”和 “ 低 ” 两 种 状态 之 间 的 信号 转换 过 程 ， 对 在 数据 记 
录 和 通信 设备 中 保持 数据 同步 非常 有 帮助 。 因 此 ，ASCII 码 、EBCDIC 码 和 统一 字符 编码 通常 都 会 在 
被 传输 或 记录 前 ， 被 转换 成 其 他 代码 。 这 种 转换 一 般 由 数据 记录 和 发 送 设备 中 的 电子 控制 部 件 自 动 完 
成 。 用 户 和 计算 机 主机 都 不 会 意识 到 这 种 转变 的 发 生 。 

通信 设备 利用 传输 介质 〈 例 如 铜 导 线 ) 中 传递 的 “高 ”、“ 低 ”脉冲 信号 来 发 送 和 接收 数据 字 节 。 
磁 存 储 设备 利用 磁极 性 的 变化 ， 称 为 磁 通 量 反 转 (fliux reversals)， 来 记录 数据 。 某 种 类 型 的 编码 方式 
可 能 更 适合 于 数据 通信 ， 而 不 是 数据 记录 。 为 了 适应 记录 方式 的 变革 ， 以 及 不 断 改 进 的 传输 和 记录 介 
质 , 不 断 有 新 的 编码 方式 发 明 出 来 。 本 书 仅 限于 研究 几 个 比较 流行 的 记录 和 传输 编码 方式 ， 并 且 讨 论 
怎样 克服 此 领域 所 过 到 的 一 些 挑战 。 为 了 简单 起 见 ， 下 面 将 采用 数据 编码 (data encoding) 这 个 术 诸 
来 表示 把 一 个 简单 字符 代码 ， 如 ASCII 码 ， 转 换 为 便于 存储 和 传输 的 其 他 代码 的 过 程 。 而 编码 数据 
(encoded data) 则 表示 已 经 被 编码 的 字符 的 代码 。 


2.7.1 不 归 零 编码 


最 简单 的 数据 编码 方式 是 不 归 零 编码 《non-return-to-zero，NRZ) 方式 。 使 用 这 种 编码 方式 意味 
着 用 “高 ”和 “ 低 ” 来 表示 1 和 0: 1 通常 为 高 电压 ，0 位 低 电 压 。 通 常 高 电压 为 正 3 伏 或 者 正 5 伏 ， 
而 低 电压 为 负 3 伏 或 者 负 5 伏 (如果 反 过 来 ， 在 逻辑 上 也 是 等 效 的 )。 

例如 ， 英 语 单词 OK 的 具有 偶数 奇偶 校 验 的 ASCH 编码 为 11001111 01001011。 图 2-9 按照 信和 号 
形式 和 磁 通 量 形式 给 出 了 这 个 单词 的 NRZ 编码 模式 。 其 中 每 一 位 在 传输 介质 中 占据 一 个 小 的 时 间 段 ， 
或 者 在 磁盘 中 占据 一 个 小 的 空间 。 这 些小 的 时 间 段 和 空间 被 称 为 位 元 (bit celb 。 

从 图 中 可 以 看 出 ， 在 ASCII 码 O 中 有 一 长 串 1。 如 果 发 送 单词 OK 的 较 长 的 形式 OKAY， 就 会 出 
现 一 个 长 串 的 0 和 一 个 长 串 的 1， 11001111 01001011 01000001 01011001。 除 非 接 收 器 与 发 送 器 可 以 精 
确 同步 ， 否 则 对 于 每 个 位 元 来 说 ， 不 可 能 都 知道 其 信号 持续 的 准确 时 间 。 如 果 接 收 器 同步 较 慢 ， 或 者 
是 定时 系统 发 生 错 位 ， 那 么 就 有 可 能 接收 到 的 OKAY 编码 的 位 序列 为 10011 0100101 010001 0101001， 
翻译 成 ASCII 码 ， 就 是 < EXT>>( )， 完 全 不 是 原来 所 发 送 的 单词 的 意思 (<EXT> 用 在 这 里 仅仅 表 
示 一 个 单一 的 ASCI 字符 End-of-Text， 用 十 进 制 数 表 示 是 26) 。 
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b) 磁 通 量 模式 ( 箭头 的 方向 指示 磁极 性 ) 
图 2-9 单词 OK 的 NRZ 编码 
这 个 例子 说 明了 在 NRZ 编码 中 即使 只 丢失 了 一 位 编码 ， 整 个 信息 也 可 能 变 得 不 知 所 云 。 


2.7.2 反 转 不 归 零 编码 


反 转 不 归 零 编码 (non-return-to-zero-invert，NRZJI) 方法 强调 的 是 同步 损失 方面 的 问题 。NRZI 采用 
信号 的 转变 ， 或 者 从 高 到 低 ， 或 者 从 低 到 高 的 变化 ， 来 表示 一 个 二 进 制 数 的 1， 没有 变化 则 表示 0。 英 语 单 
词 OK 的 具有 偶数 奇偶 校 验 的 NRZI 编码 如 图 2-10 所 示 。 








UHV TEOWO LL OR ON OTLO Ll 

尽管 NRZI 编码 方法 消除 了 二 进 制 数 1 的 委 失 问题 ， TT ii i 
但 是 仍然 面临 着 一 长 串 0 的 问题 。 这 有 可 能 造成 接收 器 或 ;1 
阅读 器 发 生 时 间 上 的 异 相 漂移 ， 从 而 导致 数据 位 的 丢失。 | 人 | | | 下 上 二 上 上 于 于 相生 下 下 


解决 这 个 问题 最 明显 的 方法 就 是 在 发 送 的 波形 中 注 
人 足够 多 的 信号 转变 ， 保 证 发 送 器 和 接收 器 的 同步 ， 从 
而 完整 地 保留 所 发 送 的 信息 内 容 。 


2.7.3 相位 调制 编码 


通常 称 为 相位 调制 (phase modulation，PM， 或 称 为 Manchester coding) 的 编码 方法 就 是 为 了 处 
理 同步 问题 而 设计 的 。PM 对 编码 的 每 一 位 都 提供 一 个 信号 转变 ， 二 进 制 数 1 由 上 升 转变 的 信号 给 出 ， 
0 则 伴随 一 个 下 降 转变 的 信号 。 如 果 需 要 ， 会 在 每 个 位 单元 的 边界 提供 一 个 额外 的 信号 转变 。 单 词 OK 
的 PM 编码 如 图 2-11 所 示 。 
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图 2-10 单词 OK 的 NRZI 编码 
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b) 磁 通 量 模式 ( 箭头 的 方向 指示 磁极 ) 
单词 OK 的 相位 调制 编码 (Manchester 编码 ) 

相位 调制 编码 通常 应 用 于 数据 传送 ， 比 如 局 域 网 ， 但 还 不 足以 应 用 在 数据 存储 中 。 如 果 将 PM 用 
于 磁带 和 磁盘 系统 ， 相 位 调制 编码 需要 两 倍 于 NRZ 编码 的 位 数 〈 即 每 半 个 位 单元 就 要 有 一 个 磁 通 量 的 
转变 ， 参 见 图 2-11b) 。 大 家 知道 ， 使 用 NRZ 编码 可 能 导致 难以 令 人 接受 的 高 出 错 几 率 。 因此， 好 的 编 
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码 方案 应 该 是 一 种 可 以 比较 经 济 地 在 获取 尽 可 能 大 的 存储 空间 和 产生 尽 可 能 少 的 错误 几率 之 间 取 得 平 
衡 的 方法 。 人 们 在 寻求 这 种 平衡 的 过 程 中 ， 发 展 了 许多 编码 方法 。 


2.7.4 频率 调制 编码 


作为 数字 系统 中 的 应 用 ， 频 率 调 制 (frequency modulation，FM) 编码 类 似 于 相位 调制 编码 ， 在 每 
个 位 单元 中 至 少 提供 一 个 信和 号 跃 变 。 这 些 同步 的 跃 变 发 ”TTTiToToTITITITITOTITOTOT1T0OTITT11 
生 在 每 个 位 单元 的 开始 处 。 要 对 二 进 制 数 1 进行 编码 ， | 
还 需要 在 位 单元 的 中 间 再 提供 一 个 额外 信号 跃 变 。 例 如 ，! 
单词 OK 的 FM 编码 如 图 2-12 所 示 。 ! 

从 图 中 不 难看 出 ， 相 对 于 数据 存储 的 要 求 来 说 ，FM 
只 是 比 PM 好 一 点 。 人 们 还 从 FM 方法 中 延伸 出 了 一 种 。 图 ?12 单词 OK 的 频率 调制 编码 
被 称 为 改进 的 频率 调制 (modified frequency modulation，MFM) 的 编码 方法 ， 这 种 方法 只 对 具有 连续 
的 0 的 编码 才 在 位 单元 的 边界 提供 信号 跃 变 。 使 用 MFM mrrororrrrrorrororrorry 
编码 方法 ， 只 需 对 每 两 个 位 单元 至 少 提供 一 个 信号 路 变 ， | | 
而 在 PM 或 FM 中 对 每 一 位 位 单元 都 必须 至 少 提供 一 个 1 ! 
信号 跃 变 。 人 

由 于 MFM 编码 需要 的 信号 路 变数 目 比 PM 编码 少 ， 

而 又 比 NRZ 多 ， 因此， 从 错误 控制 和 经 济 的 角度 来 看 ， 图 2 13 单词 OK 的 改进 的 频率 调制 编码 
MFM 编码 系统 是 一 种 高 效率 的 编码 方法 。 多 年 来 ，MFM 编码 实际 上 是 硬盘 存储 中 所 使 用 的 唯一 编码 
方式 。 单词 OK 的 MFM 编码 如 图 2-13 所 示 。 


2.7.5 运行 长 度 限制 编码 


运行 (作业 ) 长 度 限 制 编 码 (Run-Length-Limited，RLL) 是 一 种 对 由 字符 编码 组 成 的 字 进 行 分 块 
的 编码 方式 。 例 如 ， 把 ASCII 码 或 EBCDIC 码 翻译 成 一 组 特殊 设计 的 编码 字 ， 限 制 连续 0 出 现 的 数目 。 
如 ，RLL (d，A) 编码 允许 在 任何 一 对 相 邻 的 1 之 间 ， 出 现 最 少 d 个 和 最 多 k 个 连续 的 0。 

很 显然 ，RLL 的 编码 字 必 须 包含 比 原来 的 字符 编码 更 多 的 位 数 。 但是， 由 于 RLL 在 磁盘 上 面 是 
采用 NRZI 方式 进行 编码 ， 所 以 RLL 编码 的 数据 实际 上 在 磁 介 质 上 面 会 占有 更 少 的 空间 ， 因 为 这 种 编 
码 所 涉及 到 的 磁 通 量 的 转变 要 少 得 多 。RLL 使 用 的 编码 字 用 来 防止 磁盘 出 现 同步 损失 ， 这 种 情况 在 使 用 
一 个 “ 平 ”(flat) 的 二 进 制 NRZI 编码 的 时 候 是 会 遇 到 的 。 

尽管 存在 许多 变化 形式 , 但 RLL (2，7) 仍然 是 磁盘 系统 中 使 用 的 主流 编码 方式 。 从 技术 上 ， 它 
是 一 个 8 位 的 ASCII 或 EBCDIC 字符 的 16 位 映射 。 但 是 ， 按 照 磁 通 量 反 转 的 说 法 ， 它 比 MFM 编码 方 
式 要 高 出 50% 的 存储 效率 (关于 这 一 点 的 证 明 留 给 读者 作为 Root 
一 个 练习 ) 。 

从 理论 上 来 说 ，RLL 是 一 种 被 称 为 赫 夫 曼 编码 (Huff- 
man coding) 的 数据 压缩 形式 (将 在 第 7 章 中 进行 讨论 )。 这 
里 ， 核 心思 想 是 要 使 用 最 短 的 编码 字 的 位 组 合 方式 来 对 尽 可 个 ® OO® 
能 多 的 信息 位 的 组 合 方式 进行 编码 。 这 也 就 是 磁盘 存储 中 所 
说 的 使 用 最 小 数目 的 磁 通 量 反 转 。 这 种 理论 是 基于 这 样 一 个 
基本 假定 : 即 在 任意 的 位 单元 中 ， 数 字 1 或 者 没有 数字 1 出 Pooo Pl010)=1 P(O11)=1 
现 的 几率 相等 。 从 这 个 假定 出 发 ， 可 以 推导 出 在 任 一 对 相 邻 
的 位 单元 之 间 出 现 10 组 合 的 几率 为 0.25。(P (b=1) =1/ ©@ © 

P(0010)= 者 P(0011)= 页 
2; P (bj=0) =1/2; > 了 (bibi=10)=1/2X1/2=1/4.) 
图 2-14 给 出 了 RLL (2，7) 使 用 各 种 位 的 组 合 方式 的 几率 树 ”图 2-14 RLL (2, 7) 编码 的 几率 树 
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分 布 。 图 2-15 给 出 了 RLL (2,，7) 使 用 的 位 组 合 方式 。 
从 表 中 不 难看 出 ， 对 于 任意 可 能 的 位 的 组 合 方式 ， 不 可 能 有 多 于 7 个 连续 的 0 出 现 ， 租 亚 少 会 有 2 
个 连续 的 0 出 现 。 | 
图 2-16 比较 了 分 别 采 用 MFM 和 RLL (2, 7) NRZI 
对 单词 OK 的 编码 结果 。MFM 有 12 个 磁 通 量 的 转变 发 生 ， 
而 RLL 只 有 8 个。 如 果 磁 盘 设 计 中 的 主要 限制 因素 是 每 平 
方 毫米 磁 通 量 的 转变 数目 的 话 ， 那 么 在 相同 的 磁 介 质 面积 
上 ， 使 用 RLL 编码 方式 比 使 用 MFM 编码 方式 多 装 人 50% 
个 单词 OK 的 个 数 。 因 为 这 种 原因 ，RLL 编码 方式 在 制造 
高 密度 磁盘 驱动 器 方面 几乎 是 独一无二 的 。 图 2-15 RLL (2，7) 编码 
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图 2-16 单词 OK 的 MFM 编码 (图 的 上 半 部 ) 和 RLL (2，7) 编码 (图 的 下 半 部 ) 


2.8 错误 检测 与 校正 


不 管 所 使 用 的 编码 方法 如 何 ， 没 有 任何 一 种 通信 方式 或 者 存储 介质 是 完全 没有 错误 的 。 不 出 现 错 
误 的 这 种 情况 ， 从 物理 上 来 说 是 不 可 能 的 。 随 着 通信 速率 的 加 快 ， 数 据 位 与 位 之 间 的 时 间 间 隔 变 得 越 
来 越 短 。 另 外 ， 随 着 每 平方 毫米 的 存储 介质 存放 的 数据 位 数 越 多 ， 磁 通 量 密度 也 会 随 之 增加 。 这 样 ， 
出 错 的 几率 直接 与 每 秒 钟 所 发 送 的 数据 位 的 数目 成 正比 ， 或 者 与 每 平方 毫米 磁 空 间 存 储 的 位 数 成 正比 。 

在 2.6.3 节 中 ,我 们 曾经 提 到 通过 将 一 个 奇偶 校 验 位 加 到 ASCII 码 的 字 节 上 ， 以 确定 在 数据 传送 
过 程 中 是 否 有 数据 位 的 损失 。 这 种 编码 错误 检测 方法 的 有 效 性 是 很 有 限 的 : 简单 的 奇偶 校 验 只 能 检测 
每 个 字 节 中 所 产生 的 奇数 个 的 出 错 数目 。 如 果 出 现 两 位 错误 ， 这 种 方法 就 无 能 为 力 了 。 

在 2.7.1 节 中 ,读者 已 经 看 到 了 传送 的 单词 OKAY 的 4 字 节 序列 编码 ， 有 可 能 会 被 接收 为 3 字 节 
序列 的 < ETX>()。 这 里 值得 注意 的 是 ， 所 接收 的 第 2 个 字 节 的 序列 编码 中 ， 奇 偶 校 验 位 是 正确 的 。 
接收 器 会 将 其 视 为 好 的 数据 通过 ， 这 实际 上 也 是 没有 意义 的 。 如 果 在 传送 财经 信息 或 者 是 程序 代码 时 ， 
发 生 这 一 类 的 错误 将 会 导致 灾难 性 的 后 果 。 

在 阅读 后 面 的 章节 时 ， 读 者 需要 记 住 ， 既 不 可 能 生产 完全 没有 错误 的 介质 ， 也 不 可 能 百分之百 地 
检测 出 ， 或 者 校正 可 能 出 现在 介质 上 的 所 有 错误 。 错 误 检 测 与 校正 仍然 是 设计 现代 计算 机 系统 时 需要 
综合 考虑 的 一 个 研究 课题 。 因 此 ， 精 心 设计 的 错误 控制 系统 应 该 可 以 检测 出 合乎 预期 的 合理 的 错误 数 
日 ,或 者 在 合理 的 经 济 成 本 范围 内 进行 错误 校正 (这 里 的 “合理 (reasonable)” 一 词 与 错误 检测 和 校 
正 的 实施 过 程 有 关 )。 


2. 8. 1 ”循环 宛 余 码 校 验 


求 校 验 和 的 错误 检测 广泛 应 用 于 各 种 不 同 的 编码 系统 中 ， 从 条 形 码 到 国际 标准 书号 (International 
Standard Book Number，ISBN) 的 编码 。 这 种 自我 检查 的 编码 方式 可 以 很 快 地 检测 出 前 面 的 数字 是 否 
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出 现 误 读 错误 。 循 环 宛 余 码 校 验 (cyclic redundancy check，CRC) 是 一 种 最 初 用 在 数据 通信 中 的 求 校 
验 和 的 错误 检测 方法 ， 这 种 方法 可 以 决定 在 一 大 块 或 者 是 一 长 串 信 息 字 中 是 否 出 现 一 个 错误 。 要 校 验 
的 数据 字 块 的 规模 越 大 ， 要 求 的 校 验 和 就 越 大 ， 而 且 还 需要 对 求 校 验 和 的 方法 提供 某 种 适当 的 保护 。 
求 校 验 和 的 方法 以 及 CRC 方法 都 是 一 种 系统 性 的 误差 检测 (systematic error detection) 方案 ， 也 就 是 
把 错误 校 验 位 加 在 原始 信息 数据 位 的 后 面 。 组 成 错误 校 验 位 的 位 组 合 称 为 校正 子 (sysdrome)。 增 加 额 
外 的 错误 校 验 位 并 不 会 改变 原始 的 信息 位 的 内 容 。 

循环 元 余 码 校 验 中 的 循环 (cyclic) 一 词 涉及 到 错误 控制 系统 中 有 关 的 抽象 数学 理论 。 虽然 有 关 这 
种 理论 的 详细 讨论 已 经 超出 了 本 书 的 范围 ， 但 是 这 里 还 是 会 给 读者 展示 一 下 这 种 理论 是 如 何 发 生 作 用 
的 ， 这 样 有 助 于 大 家 理解 这 种 理论 在 经 济 有 效 地 检验 传输 错误 方面 的 能 力 。 
EEEEN 

读者 也 许 熟 悉 整 数 算术 中 有 关 模 数 的 概念 。 例 如 采用 12 小 时 的 时 钟 ， 就 是 一 个 我 们 每 天 都 用 来 指 
示 时 间 的 模 数 为 12 的 系统 。 如 果 在 11， 00 上 加 2 小时， 就 得 到 了 时 间 1: 00。 模 2 ( 模 数 为 2) 算术 
采用 的 是 两 个 没有 借 位 或 进位 的 二 进 制 操作 数 ， 其 操作 结果 同样 也 是 一 个 二 进 制 数 ， 并 且 也 是 模 2 算 
术 体 系 中 的 一 个 数 。 由 于 该 体系 中 数 的 加 法 形成 团 包 《〈 自 封闭 ) ， 而 且 具 有 单位 元 素 ， 数 学 家 称 这 种 模 
2 体系 构成 一 个 代数 域 (algebraic field) 。 

” 模 2 的 加 法 运算 的 规则 如 下 : 





0 十 0 一 0 
0 二 1=1 
1 十 0=1 
1 十 1=0 
例 2-27 求 二 进 制 数 1011 和 110 的 模 2 的 和 。 
1011 
土 110 
1101。( 模 2) 
这 种 求 和 只 有 在 模 2 体系 中 才 有 意义 。 [| 


模 2 除法 是 利用 模 2 加 法 的 规则 ， 通 过 进行 一 系列 的 部 分 求 和 运算 完成 。 例 2-28 说 明了 模 2 除法 
的 计算 过 程 。 : 

例 2-28 求 10010112 除 以 10112 的 商 和 余数 。 

1011)1001011 ”1. 把 除数 直接 写 在 被 除数 的 第 一 位 的 下 面 。 


1011 
0010 2. 对 这 些 数字 的 执行 模 2 加 法 。 
3. 从 被 除数 上 取 后 面 的 各 个 位 ， 使 得 余下 部 分 的 第 一 个 1 可 以 与 除数 中 的 第 一 
个 1 对 齐 。 
001001 . 根据 步骤 1 重新 写 下 除数 。 


4 
1011 5. 按 步骤 2 进行 相 加 。 
0010 6. 再 取 下 被 除数 的 另 一 位 。 
00101 7. 这 时 ，101z 已 经 不 够 被 1011z 来 除 ， 所 以 就 是 余数 。 
得 到 的 商 为 1010;。 图 
模 2 域 的 算术 运算 也 具有 多 项 式 的 形式 ， 就 如 同 整 数 域 中 有 类 似 的 算术 多 项 式 一 样 。 如 前 所 述 ， 
位 置 计数 系统 采用 的 是 一 种 递增 基数 指数 备 的 形式 来 表示 数字 。 例 如 ， 
10112=1X23+0X22+1X21+1X2° 
取 X=2， 则 二 进 制 数 10112 可 以 简写 成 如 下 的 多 项 式 形式 : 
1XX3 十 0XX2 十 1XXI 十 1XXo 
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而 对 于 例 2-28 中 的 除法 运算 就 变 成 了 如 下 的 多 项 式 运 算 : 
Xs 十 Xs 十 X 二 1 
Xi 十 XX 十 1 





经 过 了 上 面 的 背景 知识 介绍 ， 现 在 来 讨论 怎样 构建 循环 元 余 码 校 验 体系 (CRC) 。 下 面 通 过 举例 来 
加 以 说 明 。 
1. 假设 信息 字 节 为 工 = 1001011。 (可 以 使 用 任意 大 小 的 字 节 数 来 组 成 信息 块 )。 
2. 发 送 器 和 接收 器 都 对 某 个 任意 的 二 进 制 位 组 合 模 式 达 成 协议 ,例如 ，P = 1011z 。( 如 果 二 进 制 
的 位 组 合 模 式 的 开始 和 结束 位 都 是 1， 则 运行 效果 最 好 )。 
3, 将 1 左 移 ， 左 移 的 位 数 为 PP 的 位 数 减 1 位 ， 就 产生 了 一 个 新 的 IT 一 10010110002。 
4. 用 了 做 被 除数 ，P 做 除数 ， 进 行 模 2 除法 (如同 例 2-28 中 所 做 的 一 样 )。 略 去 商 只 留 下 余数 为 
1002 。 实 际 上 ， 这 个 余数 就 是 CRC 体系 要 求 的 校 验 和 。 
5， 把 余数 加 到 I 中 ， 就 组 成 要 发 送 的 信息 M: 
1001011000z 十 1002z 二 1001011100z 
6. 信息 接收 器 将 采用 相反 的 过 程 来 对 M 进行 解码 和 校 验 。M 应 该 可 以 被 P 严格 整除 : 
1010100 
1011)1001011100 
1011 
001001 
1011 
0010 
001011 


1011 
0000 


当 结 果 的 余数 不 为 0 时， 表示 在 M 的 传送 过 程 中 有 一 个 错误 发 生 。 当 采用 大 指数 寡 的 互 质 多 项 式 
这 种 检测 方法 的 效果 最 好 。 下 面 是 广泛 应 用 于 这 种 检测 方法 中 4 个 标准 多 项 式 。 
。CRC-CCITT (ITU-T) :XI16 十 XI12 十 X5 十 1 
。CRC-12:X12 十 XI 十 X3 十 X2 十 X 十 1 
“CRC-16 (ANSID :XI16 十 X15 十 X2 十 1 
。 CRC-32:X32 十 X26 十 X23 十 X22 十 X16 十 XI2 十 XI 十 XI10 十 X8 十 X7 十 X5 十 X4 十 十 1 
CRC-CCITT、CRC-12 和 CRC-16 都 是 对 成 对 字 节 进行 操作 的 ， 而 CRC-32 则 用 于 4 字 节 方式 ， 比 
较 适合 于 32 位 字 工 作 的 系统 。 事 实证 明 ， 采 用 这 些 多 项 式 的 CRC 方法 可 以 检测 出 超过 99. 8% 的 全 部 
的 单位 的 错误 。 

CRC 可 以 采用 查找 错误 表 的 方法 来 进行 操作 ， 而 不 必 对 字 节 的 每 一 位 都 计算 余数 。 将 各 种 可 能 输 
和 人 的 位 组 合 模式 产生 的 余数 表 直 接 “ 烧 录 ” 到 通信 和 存储 电子 设备 中 。 这 样 一 来 ， 只 需要 一 次 查找 就 
可 以 得 到 余数 ， 而 不 必 进 行 16 个 或 32 个 循环 周期 的 除法 运算 。 很 显然 ， 这 种 方法 的 使 用 取决 于 对 检 
测速 度 需求 和 采用 更 复杂 控制 电路 所 带 来 的 成 本 问题 的 平衡 。 


2. 8.2 海 阴 编码 


数据 通信 电路 比 磁盘 系统 更 容易 发 生 错 误 ， 同 时 容错 能 力也 更 强 一 些 。 在 数据 通信 中 ， 通 常 具 
有 探测 错误 的 能 力 就 已 经 足够 了 。 如 果 通 信 设 备 发 现 一 条 信息 包含 一 二村 位， 只 需 重 新 进行 传送 。 
而 对 于 存储 系统 和 存储 器 却 没有 这 种 方便 。 一 张 磁盘 有 时 存储 的 是 一 些 财务 交易 的 数据 ， 或 者 其 他 
一 些 非 再 生 的 实时 数据 的 集合 。 因 此 ， 存 储 设备 和 存储 器 不 但 要 探测 ， 而 且 还 要 校正 合理 数量 的 
错误 。 

错误 恢复 编码 技术 在 上 个 世纪 得 到 了 广泛 的 研究 。 其 中 一 种 最 有 效 的 编码 方式 ， 也 是 最 老 的 ， 是 
海 明 编码 (Hamming code) 。 海 明 编 码 采 用 的 是 奇偶 校 验 的 概念 。 在 这 里 ， 错 误 检 测 和 校正 能 力 随 着 


时 
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信息 字 中 所 加 入 的 奇偶 校 验 位 的 数目 成 正比 的 增加 。 海 明 编码 常常 使 用 在 随机 错误 最 可 能 发 生 的 情形 。 
对 于 随机 错误 ， 可 以 假定 每 一 位 出 错 的 几率 都 是 固定 的 ， 与 其 他 位 的 出 错 没有 关联 。 对 计算 机 存储 器 
而 言 ， 这 是 一 种 常见 的 错误 。 因 此 ， 在 下 面 的 讨论 中 将 按照 存储 器 的 位 错 探测 和 校正 的 方式 介绍 海 明 
编码 。 

海 明 编 码 所 使 用 的 奇偶 校 验 位 ， 也 称 为 校 验 位 〈check bit) ， 或 者 是 宛 余 位 〈redundant bit) 。 假设 
存储 的 信息 字 本 身 由 mm 位 组 成 ， 再 加 上 > 位 宛 余 位 来 进行 错误 检验 和 校正 。 最 后 形成 的 字 称 为 编码 字 ， 
它 是 一 个 由 m 位 数据 和 7 位 检验 位 组 成 的 一 个 n 位 单元 。 对 每 个 数据 字 都 有 一 个 唯一 的 ， 按 如 下 方式 


构成 的 三 m 十 7 位 的 编码 字 : 
m 位 r 位 


两 个 编码 字 之 间 不 同 的 位 的 位 置 数目 称 为 两 个 编码 字 的 海 明 距 离 (Hamming distance)。 例如 ， 有 如 下 
的 两 个 编码 字 : 





001001 
110001 

其 中 ， 它 们 有 3 个 位 置 上 的 位 是 不 同 的 ， 所 以 这 两 个 编码 字 的 海 明 距 离 就 是 3。 到 目前 为 止 ， 还 没 
有 讨论 怎样 来 产生 编码 字 ， 下 面 很 快 就 会 介绍 。 

两 个 编码 字 之 间 的 海 明 距离 对 于 错误 检验 是 非常 重要 的 。 如 果 两 个 编码 字 之 间 的 海 明 距离 相隔 d 
位 ， 那么 把 一 个 编码 字 转 换 成 另外 一 个 编码 字 需 要 有 d 个 单一 位 的 错误 产生 。 这 也 就 意味 着 这 种 类 型 
的 错误 将 不 会 被 检测 出 来 ， 因 为 两 者 都 是 合法 的 编码 字 。 如 果 要 使 生成 某 个 编码 可 以 确保 能 够 探测 出 
所 有 的 单位 错 (只 有 一 位 出 错 )， 那 么 所 有 的 编码 字 对 之 间 的 海 明 距 离 都 应 该 大 于 2。 如 果 某 个 nn 位 的 
编码 字 没 有 被 识别 成 一 个 合法 的 编码 字 ， 就 会 被 认为 是 一 个 错误 。 

对 于 任意 一 种 计算 检验 位 的 算法 ， 都 可 以 构建 出 其 全 部 合法 编码 字 的 完整 列表 。 一 种 编码 方法 中 
各 对 编码 字 之 间 的 所 存在 最 小 的 海 明 距 离 称 为 该 编码 的 最 小 海 明 距 离 (minimum Hamming distance)。 
编码 的 最 小 海 明 距 离 常常 用 符号 D (min) 表示 。 最 小 海 明 距离 决定 了 编码 校 验 错误 的 能 力 。 简 单 地 
说 ,任意 的 编码 字 X 如 果 要 被 当 作为 另外 一 个 合法 的 编码 字 Y 来 接收 的 话 ， 那 么 在 X 中 应 该 至 少 发 生 
了 D (min) 个 错误 。 因 此 ， 要 检验 & 个 〈 或 少 于 & 个 ) 的 单位 错误 ,编码 就 必须 具有 D (min) 二 
k 十 1 的 海 明 距 离 。 海 明 编码 通常 可 以 检测 出 D (min) 一 1 个 错误 ， 并 能 够 校正 (DCmin) 一 1)72| 个 错 
误 9S。 因 此 ， 要 能 够 校正 & 个 错误 ， 编 码 方法 的 海 明 距离 必须 大 于 2k 十 1。 

编码 字 是 利用 信息 字 加 上 7 个 奇偶 校 验 位 构建 而 成 。 在 继续 讨论 错误 校 验 前 ， 先 来 看 下 面 的 一 个 
简单 例子 。 最 常用 的 错误 校 验方 法 是 在 数据 位 上 加 一 个 单一 的 奇偶 校 验 位 (读者 可 以 回忆 一 下 ASCII 
字符 表示 方法 ) 。 这 种 编码 字 中 的 任何 一 位 出 现 一 个 单位 的 错误 都 会 产生 错误 的 奇偶 校 验 。 

例 2-29 假定 某 个 存储 器 的 编码 方式 是 采用 2 个 数据 位 和 1 个 奇偶 校 验 位 〈 附 在 编码 字 末 尾 )。 而 
且 使 用 的 是 偶 校 验方 法 ， 即 编码 字 中 1 的 个 数 必 须 是 偶数 。2 个 数据 位 可 以 有 4 种 不 同 字 的 组 合 。 下 面 
列 出 了 这 些 数据 字 和 相应 的 奇偶 校 验 位 ， 以 及 它们 组 成 的 4 种 可 能 的 编码 字 。 

| “数据 字 “| 奇偶 校 验 位 | 编码 


1 0 
1 0 














编码 字 由 3 位 二 进 制 数 组 成 。 很 显然 ，3 位 二 进 制 数 可 以 有 8 种 不 同 的 组 合 如 下 《〈 其 中 标注 “* 
编码 字 为 合法 的 编码 字 ) : 


名 “括号 [| 表示 取 整 函数 ， 也 就 是 求 小 于 所 括 数字 的 最 大 整数 。 例 如 1. 引 = 8， [8.9] 二 8。 
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如 果 遇 到 编码 字 001， 则 会 认为 是 非法 的 。 这 表示 该 编码 字 的 某 个 地 方 发 生 了 错误 。 例如， 假设 
存放 在 存储 器 中 的 正确 的 编码 字 为 011， 但 是 由 于 产生 了 一 个 错误 ， 结 果 变 成 了 001。 这 个 错误 可 以 被 
探测 出 来 ， 却 不 能 够 被 校正 。 这 里 还 不 可 能 准确 地 决定 编码 字 中 究竟 有 和 多少 位 被 翻 位 和 具体 是 哪 一 位 
出错 。 正 如 下 面 所 讨论 的 ， 能 够 进行 错误 校正 (或 称 为 纠 错 ) 的 编码 方式 则 要 求 有 多 于 一 位 的 奇偶 校 
验 位 。 | | 

在 上 面 的 例子 中 ， 如 果 一 个 合法 的 编码 字 出 现 2 个 错误 ， 又 会 发 生 什 么 情况 呢 ? 例 如 ， 编 码 字 011 
变 成 了 000。 这 种 错误 是 不 可 能 被 检测 出 来 的 。 如 果 和 仔细 研究 上 面 的 编码 ， 就 会 发 现 它 的 DD (min) 为 
2， 这 就 是 说 这 种 编码 方式 只 能 保证 检验 单位 错误 。 

编码 方法 的 错误 校 验 能 力 取决 于 编码 的 最 小 海 明 距 离 DD (min)， 例 2-29 就 已 经 从 错误 检测 的 观点 
展示 了 这 种 依赖 关系 。 错 误 校正 ( 纠 错 ) 需要 在 编码 中 包含 有 一 些 额 外 的 宛 余 位 。 如 果 要 对 个 错误 
进行 检测 和 校正 ， 所 要 求 的 最 小 海 明 距 离 为 D (min) = 2 上 十 1 。 最 小 海 明 距 离 可 以 保证 即使 在 发 生 
个 变化 的 情形 下 ， 所 有 的 合法 编码 字 之 间 都 有 足够 距离 来 加 以 区 别 ， 而 原来 的 非法 编码 字 只 会 和 唯 
一 的 一 个 合法 编码 字 比 较 接近 (相似 )。 这 一 点 非常 重要 ， 因 为 错误 校正 方法 就 是 把 非法 的 编码 字 变 换 
成 位 数 相 差 最 少 的 合法 的 编码 字 。 例 2-30 阐明 的 就 是 这 种 思想 。 

例 2-30 假定 有 下 列 的 4 个 编码 。( 暂 时 先 不 考虑 这 些 编码 的 产生 方式 ， 这 个 问题 将 很 快 会 进行 
讨论 。) 

00000 

01011 

10110 

11101 
首先 确定 D (min)。 仔 细 观 察 所 有 可 能 的 编码 字 对 ， 不 难 发 现 最 小 海 明 距离 为 D (min) 一 3。 因 此 ， 
这 种 编码 方式 可 以 检测 到 最 多 2 位 错误 ， 而 只 能 校正 1 位 错误 。 但 怎样 进行 错误 校正 呢 ? 假 设 读 到 的 
错误 编码 字 为 10000。 很 明显 ， 至 少 存在 1 位 错误 ， 因 为 它 不 属于 合法 编码 字 中 的 任何 一 个 。 现 在 来 计 
算 读 到 的 非法 编码 字 与 合法 编码 字 之 间 的 海 明 距 离 . 它 与 第 1 个 合法 编码 字 相 差 1 位 ， 与 第 2 个 相差 4 
位 ， 与 第 3 个 相差 2 位 ， 而 与 第 4 个 相关 3 位。 于是， 得 到 了 这 样 一 个 差额 和 挟 量 (difference vector) : 
[1, 4, 2, 31]。 利 用 这 种 编码 方法 进行 错误 校正 ， 会 自动 地 把 读 到 的 非法 编码 字 校 正 为 最 接近 的 那个 合 
法 编码 字 ， 校 正 结果 为 00000。 注 意 ， 这 种 所 谓 “ 校 正 ” 并 不 意味 着 结果 一 定 正确 。 这 里 我 们 假设 了 
可 能 出 现 的 错误 是 最 小 数目 的 错误 ， 即 1 个 错误 。 但 是 ， 有 可 能 原来 的 编码 字 为 10110， 是 因为 发 生 了 
两 个 错误 而 变 成 了 现在 的 非法 编码 10000。 

假设 确实 发 生 了 两 个 错误 ， 如 读 到 的 非法 编码 字 为 11000。 如 果 计 算得 刘 的 差额 矢量 是 上 2,.3,3,2] 并 
没有 最 接近 的 合法 编码 字 ， 因 此 不 能 进行 错误 校正 。 海 明 距离 为 3 的 编码 方式 只 能 进行 1 个 错误 的 校正 。 
并 且 ， 如 果 发 生出 现 多 于 一 个 错误 的 情况 时 ， 就 不 能 进行 错误 校正 处 理 ， 本 例 已 证 实 了 这 一 点 。 面 

至 此 ， 我 们 只 是 罗列 了 各 种 各 样 的 编码 ， 并 没有 讨论 到 这 些 编码 的 生成 方法 。 实 际 上 ， 有 许多 种 
生成 编码 的 方法 ， 其 中 最 直观 的 就 是 下 面 要 介绍 的 用 于 编码 设计 的 海 明 算法 。 在 解释 该 算法 的 各 个 实 
际 步骤 之 前 ， 先 来 介绍 一 些 背景 知识 。 

假设 要 设计 一 种 由 m 位 数据 位 和 7 位 校 验 位 组 成 的 字 的 编码 方式 ， 并 要 求 这 种 编码 方式 可 以 进行 
单位 错误 的 校正 。 显 然 ， 这 种 编码 方式 有 2” 个 合法 的 编码 字 ， 每 个 字 都 具有 唯一 的 包含 校 验 位 的 位 组 
合 形 式 。 现 在 ,我 们 只 关注 发 生 单 一 位 错误 的 情形 ， 先 来 考察 与 合法 编码 字 相 差 1 位 的 一 组 非法 编 
码 字 。 
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每 个 合法 的 编码 字 都 有 ?= 位， 其 中 的 每 一 位 都 有 可 能 发 生 错误 。 这 样 ， 每 个 合法 的 编码 字 都 有 ?= 
相差 1 位 的 非法 编码 字 。 如 果 只 考虑 每 个 合法 的 编码 字 和 由 1 个 错误 组 成 的 非法 编码 字 ， 那 么 就 存在 
与 每 个 编码 字 相 联系 的 ”十 1 种 位 的 组 合 方式 〈1 个 合法 字 和 个 非法 字 )。 因 为 每 个 编码 字 由 位 构 
成 , n = 二 m 十 +， 所 以 共有 2" 种 可 能 的 位 的 组 合 方式 。 因 此 有 下 面 的 不 等 式 : 

(nil1) X2"m<27 
其 中 , n 十 1 是 每 个 编码 字 对 应 的 位 的 组 合 方式 ，2m 是 合法 的 编码 字 的 数目 ，2" 是 各 种 可 能 的 位 
的 组 合 方式 的 总 数 。 因 为 n = m 十 r+， 所 以 不 等 式 可 以 改写 为 ; 
(m+tri+1) 义 2m< 妇 2m+r 
或 
(mm 十 r 十 1) &2" 
这 个 不 等 式 很 重要 ， 它 指定 了 要 构成 一 个 有 mm 位 数据 位 和 > 位 校 验 位 ， 并 且 可 以 校正 全 部 单一 位 错误 
的 编码 所 要 求 的 校 验 位 数目 的 下 限 。 
假定 数据 位 的 长 度 普 一 4， 有 : 
(4 十 r 十 1) 委 27 
就 是 说 ，r 必须 大 于 或 者 等 于 3。 如 果 选 择 > = 3， 这 意味 着 要 构建 一 个 有 4 位 数据 位 字 ， 可 以 校正 单 
位 错误 的 编码 系统 ， 必 须 增 加 3 位 校 验 位 。 

海 明 算法 为 设计 具有 校正 单位 错误 能 力 的 编码 系统 提供 了 一 种 直接 方法 。 按 照 以 下 步 又， 可 以 构 
建 任意 大 小 的 存储 器 字 的 错误 校正 编码 系统 。 

1. 先 确 定编 码 所 需 的 校 验 位 数目 +-， 然 后 算出 编码 字 的 位 长 度 n (n == m 十 r)， 从 右 往 左 排列 ， 
从 1 开始 (不 是 0)。 

2. 设置 位 数 满足 2 的 指数 寡 的 位 为 奇偶 校 验 位 ， 其 他 位 为 数据 位 。 

3. 对 于 各 个 编码 位 置 ， 可 以 按照 如 下 的 方式 指定 不 同 的 奇偶 校 验 位 来 检验 : 第 5 位 编码 由 满足 关 
系 站 十 加 十 … 十 已 一 加 (这 里 “十 ”表示 模 2 的 和 ) 的 奇偶 校 验 位 Bb，bs，…, 5b) 进行 校 验 。 

下 面 通过 举例 来 说 明 这 些 步骤 和 错误 校正 的 实际 过 程 。 

例 2-31 利用 上 面 介绍 的 海 明 编 码 和 偶 校 验 ， 对 8 位 ASCII 字符 K 进行 编码 〈 最 高 位 应 该 为 0) 。 
同时 ， 人 为 地 引信 一 个 单位 的 错误 ， 并 指出 怎样 找 出 这 个 错误 。 

首先 确定 KK 的 编码 字 

步骤 1: 确定 所 需 校 验 位 的 数目 ， 然 后 将 这 些 校 验 位 加 到 数据 位 中 ， 编 码 字 的 全 部 位 数 总 共有 
n 位 。 

因为 m 二 8， 有 (8 十 r 十 1) 三 2"， 这样 ,，r 必须 大 于 或 等 于 4。 这 里 选择 r 一 4。 

步骤 2， 从 1 开始， 按照 从 右 往 左 的 顺序 对 n 位 编码 进行 编号 ， 结 果 如 下 : 


1 











1211109 8 7 6 5 了 3 
奇偶 校 验 位 用 方块 来 进行 标记 。 
步骤 3; 分 配 指定 校 验 各 个 不 同位 置 上 的 位 的 奇偶 校 验 位 。 
六 此 ， 首 先 将 所 有 各 个 位 的 位 置 按照 2 的 寡 指 数 写成 求 和 形式 ， 





co 癌 ] 


1=1 5 一 1 十 4 9 一 1 十 8 
2 一 2 6 一 2 十 4 10 一 2 十 8 
3 二 1 十 2 7 一 1 十 2 十 4 11=14 2 十 8 
4 一 4 8 一 8 12 一 4 十 8 


因为 第 1、3、5、7、9、11 位 的 求 和 表达 式 中 有 数字 1， 所 以 第 1 位 〈 最 低位 ) 的 奇偶 校 验 位 将 反映 这 
些 位 置 上 各 个 位 的 奇偶 校 验 特性 。 类 似 地 ，2 对 2、3、6、7、10、11 起 作用 ， 所 以 第 2 位 的 奇偶 校 验 
位 将 反映 这 组 位 置 上 的 位 的 奇偶 校 验 特性 。 第 4 位 为 第 4、5、6、7、12 位 提供 奇偶 校 验 ， 而 第 8 位 为 
第 8、9、10、11、12 位 提供 奇偶 校 验 。 在 没有 标注 方块 的 空白 位 置 上 依次 写 下 数据 位 ， 然 后 加 上 奇偶 
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校 验 位 ， 就 得 到 了 如 下 的 编码 字 ， 














1 [0 1g 
5 4 3 2 1 























因此 ，K 的 编码 字 为 010011010110。 

现在 ,在 bs 位 引入 一 个 错误 ， 就 将 编码 字 变 成 了 010111010110。 然 后 利用 奇偶 校 验 位 来 校 验 各 不 
同 的 位 组 合 ， 结 果 如 下 : 

第 1 位 的 奇偶 校 验 位 对 第 1、3、5、7、9、11 位 进行 校 验 ， 因 为 采用 的 是 偶 校 验 ， 所 以 产生 1 个 
错误 。 

第 2 位 的 奇偶 校 验 位 校 验 第 2、3、6、7、10、11 位 ， 没 有 出 错 。 

第 4 位 的 奇偶 校 验 位 校 验 第 4、5、6、7、12 位 ， 没 有 出 错 。 

第 8 位 的 奇偶 校 验 位 校 验 第 8、9、10、11、12 位 ,产生 1 个 错误 。 
第 1 位 和 第 8 位 奇偶 校 验 位 的 校 验 出 错 ， 它 们 共同 校 验 的 位 为 第 9 位 和 第 11 位 ， 所 以 单位 的 错误 一 定 
出 现在 第 9 位 或 第 10 位 。 但是， 由 于 第 2 位 奇偶 校 验 位 在 其 校 验 的 位 置 组 合 中 包含 了 第 11 位 ， 并 指 
出 第 11 位 没有 出 错 ， 所 以 错误 一 定 发 生 在 第 9 位 ， 这 也 正 是 我 们 人 为 设置 的 错误 位 。 即 使 没有 任何 发 
生 错 误 的 位 置 的 线索 ， 通 过 上 面 介 绍 的 方法 也 可 以 准确 界定 错误 发 生 的 位 置 。 要 校正 这 个 错误 ， 只 要 
简单 地 对 这 一 位 〈 第 9 位 ) 执行 取 反 操作 。 

因为 这 里 的 奇偶 校 验 采用 的 是 组 合 定位 的 方式 ， 所 以 找 出 错误 位 的 一 个 更 简单 的 方法 是 将 校 验 出 
错 的 奇偶 校 验 位 的 位 置 进行 相 加 ， 可 以 直接 得 出 错误 位 的 位 置 。 例 如 ， 本 例 中 第 1 位 和 第 8 位 的 奇偶 
校 验 都 产生 一 个 错误 ，1 十 8 = 9, 第 9 位 也 正 是 编码 出 错 的 位 置 。 国 

在 第 3 章 中 ， 读 者 将 会 看 到 只 需 利用 一 个 简单 的 二 进 制 电路 ， 就 可 以 非常 方便 地 实现 海 明 编 码 技 
术 。 因 为 这 种 方法 简单 可 行 ， 所 以 可 以 很 经 济 方 便 地 在 系统 中 添加 海 明 编码 来 实现 数据 保护 ， 而 且 对 
系统 的 性 能 所 造成 的 影响 最 小 。 


2. 8.3 里 德 -所 罗 门 编码 


海 明 编 码 系 统 在 出 错 率 非常 低 的 合理 情况 下 非常 有 效 。 对 于 固定 磁盘 驱动 器 来 说 ， 出 错 率 在 一 亿 
分 之 一 的 数量 级 。 因 此 ， 上 面 所 介绍 的 3 位 海 明 编码 系统 可 以 非常 方便 地 校正 这 种 类 型 的 错误 。 但 是 ， 
海 明 编码 在 遇 到 多 个 相 邻 数据 位 发 生 损坏 的 情况 时 ， 就 会 变 得 毫 无 用 处 。 这 种 类 型 的 错误 称 为 区 块 错 
误 (burst error， 或 称 为 突 发 错误 ) 。 因 为 操作 处 理 不 当 和 外 界 环境 影响 所 引起 的 应 力 等 主要 因素 ， 区 
块 错误 在 移动 性 记录 介质 方面 ， 比 如 磁带 和 压缩 光盘 (CD)， 是 很 普遍 的 。 

如 果 出 错 的 情况 是 成 块 发 生 ， 就 应 该 使 用 能 够 处 理 块 状 错误 的 纠 错 编 码 系 统 ， 而 不 是 海 明 编码 。 
海 明 编 码 只 能 进行 一 些 单位 级 别 的 出 错 处 理 。 里 德 -所 罗 门 (Reed-Soloman， 简称 RS) 编码 属于 CRC 
类 型 的 编码 ， 主 要 处 理 的 是 整个 字符 块 ， 而 不 仅仅 是 几 个 位 。RS 编码 和 CRC 一样， 是 一 种 系统 编码 
方式 : 即 在 信息 字 节 块 上 加 有 奇偶 校 验 位 。RS (n, &) 编码 中 的 各 参数 定义 为 ， 

“二 一 个 字符 (或 者 “符号 ”) 所 占 位 的 数目 。 

*“A 二 构成 数据 块 的 :位 字符 的 数目 。 

* 7 二 编码 字 的 位 的 数目 。 

(n—k) 


RS (n, &) 可 以 在 个 信息 字 节 组 成 的 编码 字 中 校正 一 一 个 错误 。. 


因此 ,现在 流行 的 RS (255，233) 编码 方式 是 采用 223 个 8 位 的 信息 字 节 ， 加 上 32 个 错误 校正 
字 节 ， 来 构成 255 字 节 的 编码 字 。 可 以 校正 信息 块 中 多 达 16 个 的 错误 字 节 。 

. 里 德 - 所 罗 门 编码 的 编码 发 生 器 多 项 式 由 一 个 称 为 血 罗 瓦 域 (Galois field) 的 抽象 数学 结构 所 定义 
的 多 项 式 给 出 〈 在 这 里 ， 对 伽 罗 瓦 数学 的 细节 讨论 会 有 些 离 题 太 远 ， 读 者 可 以 参考 本 章 结 尾部 分 的 参 
考 文献 ) 里 德 -所 罗 门 通用 多 项 式 为 : 


Eg(T)=(x—a) (raitl). (rz—ait2) 
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式 中 上 二 n 一 k，x 是 一 个 完整 的 字 节 (或 “符号 ”)，g (zx) 是 对 域 GF (2;) 执行 操作 (注意 ;这 
个 多 项 式 是 在 伽 罗 瓦 域 进行 展开 的 ， 与 常规 代数 中 使 用 的 整数 域 有 很 大 区 别 ) 。 

2 字 节 的 RS 编码 字 要 使 用 下 面 的 方程 式 进行 计算 : 

C(xX)—=g(r) Xi(z) 

其 中 ，i (z) 为 信息 块 。 

尽管 这 些 代数 看 起 来 非常 复杂 而 且 令 人 生生， 但 是 里 德 - 所 罗 门 纠 错 算法 可 以 非常 有 效 地 在 计算 机 
硬件 中 实现 。 它 们 已 经 成 功 使 用 在 计算 机 主机 的 高 性 能 磁盘 驱动 器 ， 以 及 用 于 音乐 和 数据 存储 的 压缩 
光碟 之 中 。 这 些 里 德 -所 罗 门 算法 的 实现 方法 将 在 第 7 章 介 绍 。 


本 章 小 结 


本 章 主 要 介绍 了 数字 计算 机 中 采用 的 数据 表示 方法 和 数值 运算 的 基本 知识 。 要 求 掌 握 数 字 在 不 同 的 数 
基 之 间 相 互 转换 的 技巧 和 方法 ， 并 且 要 熟 记 那些 较 小 的 十 六 进 制 数 字 和 二 进 制 数字 。 这 些 基本 知识 对 后 续 
章节 的 学 习 是 非常 有 用 的 。 有 关 十 六 进 制 编码 的 内 容 ， 对 于 需要 在 一 个 系统 崩溃 后 读 取 和 修复 硬盘 残余 的 
核心 数据 ， 或 者 是 希望 在 数据 通信 方面 从 事 一 些 深入 工作 ， 都 是 非常 有 价值 的 。 

对 于 浮 点 数字 的 运算 ,计算 中 的 重复 迭代 过 程 可 以 使 一 个 微小 的 误差 演变 成 一 个 重大 的 错误 。 有 许多 
不 同 的 数学 技巧 可 以 用 来 对 浮 点 运算 的 误差 进行 控制 ， 详 细 讨 论 这 些 技术 已 经 超出 本 书 的 范围 。 

目前 的 大 多 数 计算 机 使 用 ASCI 和 EBCDIC 代码 来 表示 各 种 字符 。 通 常 没有 必要 记 住 所 有 字符 的 纺 
码 。 但 是 ， 如 果 在 工作 中 需要 频繁 使 用 这 些 字符 编码 ， 不 妨 掌握 若干 “关键 字符 的 编码 值 "， 从 这 些 数值 出 
发 就 可 以 算出 大 部 分 所 需 的 的 其 他 字符 编码 值 。 

统一 编码 字符 是 Java 编程 语言 和 Windows 新 版 本 操作 系统 的 默认 字符 。 它 有 可 能 取代 EBCDIC 和 
ASCIT， 成 为 计算 机 系统 中 字符 表示 的 基本 方法 。 然 而 ， 原 来 老 的 编码 方法 ， 由 于 经 济 适用 和 深入 普及 ， 
还 将 会 继续 使 用 较 长 的 一 段 时 间 。 

学 习 数 据 字 节 在 磁盘 和 磁带 上 的 存储 方法 有 助 于 理解 有 关 数 据 存储 方面 的 许多 问题 。 熟 悉 和 理解 各 种 
错误 控制 方法 对 于 学 习 数 据 存储 和 数据 通信 都 很 有 益处 。 更 多 的 有 关 数 据 存储 方面 的 内 容 将 在 第 7 章 介绍 ， 
而 有 关 数 据 通 信 的 最 新 课题 也 会 在 第 11 章 中 加 以 阐述 。 

错误 检测 和 校正 的 编码 技术 实际 上 已 经 应 用 于 计算 技术 的 各 个 领域 。 了 解 错误 控制 的 方法 有 助 于 我 们 
在 各 种 可 利用 错误 校 验方 案 中 做 出 明智 的 决策 。 选 择 正确 的 方法 需要 考虑 算法 成 本 和 所 使 用 的 存储 和 传输 
介质 的 容量 等 因素 。 
深入 阅读 

从 有 关 西 方 文明 中 早期 数学 发 展 简 史 中 ;可 阅读 Bunt (1988) 的 著作 。 

Knuth (1998〉 在 其 有 关 计 算 机 算法 系列 从 书 的 第 2 卷 中 详尽 有 趣 地 讨论 了 数字 体系 和 计算 机 算术 的 
历史 发 展 过 程 〈 建 议 每 位 计算 机 科学 家 们 人 手 一 套 Knuth 的 著作 )。 

有 关 浮 点 算术 的 权威 定义 可 以 参阅 Goldberg (1991) 的 文章 。Schwartz 等 人 (1999) 介绍 了 IBM Sys- 
tem/390 计算 机 怎样 使 用 原来 的 浮 点 表示 形式 和 IEEE 的 新 标准 执行 浮 点 操作 。 而 Soderquist 和 Leeser 
(1996) 对 有 关 浮 点 除法 和 求 平方 根 的 问题 做 了 详尽 而 精妙 的 讨论 。 

有 关 统 一 编码 字符 的 详细 资料 可 以 在 同一 编码 字符 协会 的 网 站 : www. unicode. org ， 以 及 其 出 版 物 : 
Unicode Standard Version 3.0 〈2000) 中 找到 。 

国际 标准 化 组 织 的 网 站 地 址 是 : www. iso. ch 。 该 组 织 的 影响 范围 很 大 ， 从 该 网 站 可 以 找到 很 多 有 用 
的 信息 。 同 样 ， 美 国 国家 标准 委员 会 的 网 站 : www, ansi. org 也 提供 类 似 的 有 用 信息 。 

与 数据 存储 有 关 的 数据 编码 的 权威 资料 可 以 参考 许多 有 关 电 气 工程 方面 的 书籍 。 这 些 书籍 的 内 容 涉及 
到 各 种 物理 介质 的 基本 特性 ， 以 及 各 种 不 同 的 编码 方法 的 优 劣 比较 。 其 中 ，Mee 和 Daniel (1988) 的 著作 
也 许 会 很 有 帮助 。 

在 掌握 了 第 3 章 的 基本 概念 后 ， 可 以 进一步 阅读 Arazi 的 著作 (1988)。 这 本 精心 编撰 的 书籍 介绍 了 如 
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何 使 用 一 些 简 单 的 数字 电路 来 实现 错误 的 检测 和 校正 。 该 书 的 附录 对 应 用 在 里 德 -所 罗 门 编码 中 有 关 伽 罗 
瓦 域 的 数学 做 了 详尽 精辟 的 讨论 。 

如 果 需 要 认真 细致 地 研究 错误 校正 理论 ， 学 习 Pretzel (1992) 的 著作 是 一 个 很 好 的 开始 ， 该 书 结构 合 
理 、 内 容 丰 富 ， 而 且 通 俗 易 懂 。 

有 关 伽 罗 瓦 域 的 详细 论述 可 以 参阅 Artin (1998) 和 Warner (1990) 的 著作 。Warner 的 书籍 清晰 和 全 
面 地 介绍 了 抽象 代数 的 概念 。 学 习 抽 象 代数 对 研究 数学 密码 学 很 有 帮助 ， 这 是 计算 机 科学 中 一 个 非常 令 人 
感 兴趣 的 领域 。 


参考 文献 


Arazi, Benjamin. A Commonsense Approach 1o the Theory of Error Correcting Codes. Cambridge. 
MA: The MIT Press, 1988. 


Artin, Emil. Galois Theory. New York: Dover Publications, 1998. 


Bunt. Lucas N. H.. Jones, Phillip S., & Bedient, Jack D. The Historical Roots of Elementary Mathe- 
maltics. New York: Dover Publications. 1988. 


Goldberg. David. “What Every Computer Scientist Should Know About Floating-Point Arith- 
metic.” ACM Computing Surveys 23:1 March 1991. pp. 5-47. 


Knuth, Donald E. The Arr of Computer Programming, 3" ed. Reading, MA: Addison-Wesley. 1998. 


Mee. C. Denis, & Daniel. Eric D. Magnetic Recording, Volume 11: Computer Data Storage. New 
York: McGraw-Hill, 1988. 


Pretzel. Oliver. Error-Correcting Codes and Finite Fields. New York: Oxford University Press, 1992. 


Schwartz, Eric M., Smith. Ronald M.. & Krygowski, Christopher A. “The S$/390 G5 Floating-Point 
Unit Supporting Hex and Binary Architectures.” JEEE Proceedings from the 141h Svmposium 
on Computer Arithmeric. 1999. pp. 258-—265. 


Soderquist. Peter. & Leeser. Miriam. “Area and Performance Tradeotfs in Floating-Point Divide and 
Square-Root Implementations.” ACM Computing Surveys 28:3. September 1996. pp. 518-564. 


The Unicode Consortium. The Unicode Standard, Version 3.0. Reading. MA: Addison-Wesley. 2000. 
Warner, Seth. Modern Algebra. New York: Dover Publications, 1990. 


基本 概念 和 术语 复习 

1. 单词 oz 是 哪 两 个 词 的 缩写 ? 

2. 解释 名 词 位 、 字 节 、 半 字 节 和 字 ， 以 及 它们 之 间 的 相互 关系 。 

3. 为 什么 二 进 制 和 十 进 制 数 制 称 为 位 置 计数 体系 ? 

4. 什么 是 基数 ? 

5. 对 于 图 2-1 中 “需要 记忆 的 数字 ”( 包 括 其 中 的 各 种 基数 )， 想 一 想 能 够 记 住 多 少 个 数字 ? 

6 对 于 无 符号 数字 ， 滋 出 是 什么 意思 ? 

7. 列举 数字 计算 机 中 带 符号 整数 的 三 种 表示 方法 的 名 称 ， 并 且 解 释 这 三 种 表示 方法 之 间 的 区 别 。 
8. 数字 计算 机 系统 最 常 采用 的 是 三 种 整数 表示 方法 中 的 哪 一 种 ? 

9. 对 于 像 自 行车 里 程 表 这 类 的 补 码 系统 是 如 何 构 建 的 ? 

10. 使 用 本 章 中 介绍 的 倍 乘 转换 法 是 否 要 比 其 他 传统 的 二 -十 进 制 的 转换 方法 更 容易 一 些 ? 并 解释 原因 。 
11. 参照 上 一 个 问题 ， 说 明 其 他 两 种 传统 的 二 -十 进 制 转换 方法 有 什么 缺点 。 


12， 什 么 是 溢出 ?以 及 如 何 检测 淡出 ?在 带 符号 数 中 的 游 出 和 在 无 符号 数 中 的 溢出 有 什么 区 别 ? 

13， 如 果 计 算 机 只 能 处 理 和 存储 整数 ， 那 么 计算 机 系统 在 处 理 数 字 时 会 遇 到 哪些 困难 ? 如 何 克 服 这 些 困 难 ? 
14. 浮 点 数 由 哪 三 部 分 组 成 ? 

15. 什么 是 偏 移 指数 ? 使 用 偏 移 指数 有 什么 好 处 ? 

16. 什么 是 规格 化 ? 为 什么 要 使 用 规格 化 ? 
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17. 为 什么 使 用 二 进 制 计算 机 进行 浮 点 运算 时 中 总 是 存在 不 同 程度 的 误差 ? 
18. 在 IEEE-754 浮 点 标准 中 ， 双 精度 数 的 长 度 是 多 少 位 ? 

19. 什么 是 EBCDIC? 它 与 BCD 有 何 关 系 ? 

20. 什么 是 ASCII? ASCII 是 怎样 产生 的 ? 

21. 一 个 统一 编码 字符 需要 用 多 少 二 进 制 位 来 表示 ? 

22. 为 什么 会 产生 统一 编码 字符 ? 

23. 在 对 磁盘 进行 写 数据 时 ， 为 什么 要 避免 使 用 不 归 零 的 编码 方式 ? 
24. 在 对 磁盘 进行 写 数据 时 ， 为 什么 曼彻斯特 编码 不 是 一 个 好 的 选择 ? 
25. 试 解释 运行 长 度 限 制 编 码 方式 的 工作 原理 。 

26. 试 解释 循环 元 余 校 验方 法 的 工作 原理 是 什么 ? 

27, 什么 是 系统 性 的 误差 检测 ? 

28. 什么 是 海 明 编 码 ? 

29. 什么 是 海 明 距 离 ” 为 什么 海 明 距 离 很 重要 ? 最 小 海 明 距 离 是 什么 ? 
30, 在 错误 校 验 编码 中 ， 砚 余 位 的 位 数 和 数据 位 的 位 数 之 间 有 什么 关系 ? 
31. 什么 是 区 块 〈 集 束 ) 错误 ? 

32. 说 出 一 种 可 以 修补 区 块 错误 的 错误 校 验方 法 的 名 称 ? 


练习 题 


令 1. 利用 减法 或 者 除法 -余数 方法 进行 下 列 各 个 不 同 数 基 之 间 的 数字 转换 : 
2 a) 458io 一 3 





全 b) 6771, = 5 
@ c) 15181= 7 
@ d) 440lo= 9 
2. 利用 减法 或 者 除法 -余数 方法 进行 下 列 各 个 不 同 数 基 之 间 的 数字 转换 : 
a) 588i 一 3 
b) 22541 = 5 
c) 65210 = 7 
d) 31041 = 9 





令 3. 将 下 面 的 十 进 制 小 数 转换 成 二 进 制 数 ， 小 数 点 后 最 多 取 6 位: 
@ a) 26.78125 
@ b) 194.03125 
@ c) 298.796875 
@ d) 16.1240234375 
4. 将 下 面 的 十 进 制 小 数 转换 成 二 进 制 数 ， 小 数 点 后 最 多 取 6 位 : 
a) 25.84375 
b) 57.55 
c) 80. 90625 
d) 84.874023 
5. 分 别 使 用 8 位 的 符号 幅 值 、 反 码 和 补 码 方 式 来 表示 如 下 的 十 进 制 数 : 
令 a) 77 
Sb) 一 42 
c) 119 
d) 一 107 


6. 使 用 一 个 3 位 的 “ 字 ”，， 列 出 所 有 可 能 的 带 符号 的 二 进 制 数 ， 并 写 出 它们 用 下 列 方 法 表示 的 十 进 制 的 等 
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效 数 字 。 
a) 符号 幅 值 
b) 反 码 
c) 补 码 
7. 使 用 一 个 4 位 的 “ 字 ”， 列 出 所 有 可 能 的 带 符号 的 二 进 制 数 ， 并 写 出 它们 用 下 列 方法 表示 的 十 进 制 的 等 
效 数字 。 
a) 符号 幅 值 
b) 反 码 
c) 补 码 
. 对 于 任意 给 定位 数 zx， 从 前 面 两 个 问题 的 答案 ， 总 结 妇 纳 出 采用 下 列 方法 可 以 表示 的 十 进 制 数值 的 范围 ; 
a) 符号 幅 值 
b) 反 码 
c) 补 码 
. 假设 有 一 个 只 有 6 位 字 长 度 的 小 型 计算 机 系统 ， 请 问 这 个 计算 机 采用 如 下 方式 可 以 表示 的 最 小 负数 和 最 
大 正 数 分 别 是 多 少 ? 
a) 反 码 
b) 补 码 
10. 假如 读者 在 做 环球 航海 旅行 时 ， 阁 人 了 一 个 未 知 的 文明 社会 。 这 里 的 人 民 自 称 为 Zebronians， 他 们 使 用 
40 个 分 立 的 字符 〈 可 能 是 因为 斑马 身上 有 40 根 黑白 相间 的 条 纹 ) 来 进行 数学 运算 。 他 们 非常 喜欢 使 用 
计算 机 ， 但 是 他 们 需要 可 以 从 事 Zebronian 数学 运算 的 计算 机 ， 也 是 说 一 种 可 以 表示 全 部 40 个 字符 的 
计算 机 。 作 为 一 位 计算 机 设计 人 员 ， 你 决定 最 好 的 方式 是 使 用 BCZ; 即 二 进 制 编码 的 Zebronian 字符 
(类 似 于 BCD 编码 ， 只 不 过 它 是 对 Zebronian 字符 编码 ， 而 不 是 对 十 进 制 数 进行 编码 )。 请 问 ， 利 用 最 
少 的 二 进 制 位 来 表示 每 个 字符 ， 需 要 多 少 位 数 ? 
11. 完成 下 列 二 进 制 数 的 乘法 运算 : 
急 a) 1100 
X101 
b) 10101 
xul 
c) 11010 
x 1100 
12, 完成 下 列 二 进 制 数 的 乘法 运算 : 
a) 1011 
X101 
b) 10011 
X1011 
c) 11010 
X1011 
13. 完成 下 列 二 进 制 数 的 除法 运算 ， 
全 a) 101101 二 101 
b) 10000001 二 101 
c) 1001010010 二 1011 
14. 完成 下 列 二 进 制 数 的 除法 运算 : 
a) 11111101 二 1011 
b) 110010101 一 1001 
c) 1001111100 一 1100 


Oo 


CC 
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全 15. 
.使 用 符号 幅 值 表示 法 ， 完 成 下 面 的 演算 : 


18. 


令 19. 


20. 


21. 
22. 


23. 


24. 


@25 


使 用 倍 乘 转换 法 将 10212; 直接 转换 成 十 进 制 数 〈 提 示 : 要 改变 乘 数 ) 。 


十 0 十 《一 0) = 
(一 0》 十 0 二 

0 十 0 一 

《一 0) 二 (一 0) = 


,假设 一 台 计算 机 使 用 4 位 反 码 表示 数字 。 不 考虑 溢出 现象 ， 请 问 : 在 下 面 的 一 个 假想 的 编码 过 程 结束 


后 ， 变 量 7 中 存储 的 数值 是 什么 ? 
0 一 了 // Store 0 in j. 
-3 k // Store -3 in k. 
while k <* 0 


j=j+1 
k=k- 1 
end while 


假设 某 个 计算 机 系统 中 存储 的 浮 点 数 具 有 1 个 符号 位 、3 位 指数 和 4 位 有 效 位 数 。 

a) 如 果 存储 系统 是 采用 规格 化 的 ， 试 问 : 该 系统 可 以 存储 的 最 大 正 数 和 最 小 正 数 是 多 少 ? 假定 没有 其 
他 隐 含 的 位 数 ， 不 使 用 偏 移 指数 ， 指 数 采用 补 码 表 示 法 ， 并 且 人 允许 全 0 和 全 1 的 数值 。 

b) 如 果 希 望 所 有 的 指数 都 为 非 负 数 ， 应 该 使 用 的 偏 移 值 为 多 少 ? 为 什么 选择 这 个 偏 移 值 ? 

使 用 上 一 题 的 模型 ， 包 括 所 选择 的 偏 移 值 ， 对 下 面 的 2 个 浮 点 数字 进行 加 法 运算 ,并 且 要 求 得 到 结果 

采用 与 下 面 的 加 数 和 被 加 数 相同 的 表示 方法 : 


0O1li 
010 


如 果 结 果 与 上 一 题 有 误差 的 话 ， 请 计算 相对 误差 。 
假定 采用 本 书 所 给 的 浮 点 表示 法 的 简单 模型 (该 表示 使 用 14 位 格式 ， 其 中 5 位 表示 指数 ， 指 数 的 偏 移 
值 为 16，8 位 是 规格 化 的 昆 数 ， 还 有 1 个 符号 位 ): 
a) 证 明 计算 机 怎样 使 用 这 种 浮 点 格式 来 表示 数字 100.0 和 0. 25 。 
b)》 证 明 计算 机 如 何 通过 改变 其 中 一 个 浮 点 数 ， 使 得 这 两 个 浮 点 数 都 按照 2 的 相同 的 短 指 数 表示 ， 来 实 
现 上 面 这 两 个 浮 点 数 的 加 法 运算 。 
c) 证 明 计算 机 如 何 使 用 上 面 的 浮 点 表示 法 来 表示 这 两 个 浮 点 数 的 求 和 结果 。 计 算 机 实际 存储 的 求 和 结 
果 的 十 进 制 数值 是 多 少 ? 请 解释 原因 ? 
是 什么 原因 造成 除法 下 滋 ? 使 用 什么 方法 可 以 解决 这 个 问题 ? 
为 什么 计算 机 常常 采用 规格 化 形式 来 存储 浮 点 数 ? 试 对 比 在 指数 中 加 入 符号 位 的 方法 ， 使 用 偏 移 值 的 
规格 化 形式 的 表示 方法 有 什么 优点 ? 
假设 a = 1.0X2 ，6= 一 1.0X2， 和 ec = 1.0X2!。 利 用 书 中 介绍 的 浮 点 模型 《该 表示 使 用 14 位 格 
式 ， 其 中 5 位 表示 指数 ， 指 数 的 偏 移 值 为 16，8 位 是 规格 化 的 尾数 ， 还 有 1 个 符号 位 ) ， 进 行 下 面 的 计 
算 。 要 特别 注意 运算 操作 的 次 序 。 在 这 个 有 限 模型 中 ， 浮 点 算术 在 代数 性 质 上 有 什么 特点 ” 在 进行 乘 
法 运算 时 ， 是 否 还 会 像 加 法 运算 一 样 ， 存 在 这 种 代数 性 质 上 的 反常 行为 ? 
6 十 (ac 十 c) = 
(6 十 a) 十 c = 
a) 已 知 A 的 ASCI 编码 为 1000001， 请 问 : 村 的 ASCII 编码 为 多 少 ? 
b) 已 知 A 的 EBCDIC 编码 为 11000001， 请 问 : J 的 EBCDIC 编码 为 多 少 ? 


1 
1 


1000 
1001 


.假设 计算 机 使 用 的 是 24 位 字 。 试 在 如 下 的 情形 下 ， 利 用 24 位 来 表示 数值 295。 


令 a) 如 果 计 算 机 使 用 偶 校 验 ， 如 何 表示 十 进 制 数 295? 
令 b) 如 果 计 算 机 使 用 8 位 ASCII 编码 和 偶 校 验 ， 如 何 表示 字符 串 295? 
令 c) 如 果 计 算 机 使 用 压缩 的 BCD 编码 ， 如 何 表示 数字 十 295? 





26. 


全 27. 


28. 


29. 
30, 


31. 
32, 


33. 


34. 


37， 
38. 
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假设 下 面 的 编码 为 7 位 ASCII 字符 ， 并且 没有 奇偶 校 验 位 ， 试 对 下 面 的 ASCII 信息 进行 解码 : 
1001010 1001111 1001000 1001110 0100000 1000100 1001111 1000101 

为 什么 系统 设计 人 员 都 愿意 采用 统一 编码 字符 作为 新 的 计算 机 系统 的 默认 字符 集 ” 如 果 不 采 用 统一 编 
码 字 符 ， 你 会 给 出 什么 理由 ? 

采用 下 面 的 编码 方式 ， 编 写字 符 4 的 7 位 ASCII 代码 : 

a) 非 返回 0 

b) 非 返回 0 - 反 转 

c) 曼彻斯特 编码 

d) 频率 调制 

e) 改进 的 频率 调制 

f) 运行 长 度 限制 

为 什么 NRZ 编码 很 少 在 磁 介 质 的 数据 记录 中 使 用 ? 

假设 要 创建 一 种 编码 方式 ， 使 用 3 个 信息 位 ，1 个 奇偶 校 验 位 (附加 在 信息 位 的 后 面 );， 并 采用 奇 校 验 。 
请 列 出 这 种 编码 的 全 部 合法 编码 字 。 这 种 编码 方式 的 海 明 距 离 是 多 少 ? 

纠 错 海 明 编 码 是 系统 性 的 编码 方式 吗 ? 请 解释 原因 ? 

计算 下 列 编码 的 海 明 距 离 : 

0011010010111100 

0000011110001111 

0010010110101101 

0001011010011110 

计算 下 列 编码 的 海 明 距 离 : 

0000000101111111 

0000001010111111 

0000010011011111 

0000100011101111 

0001000011110111 

0010000011111011 

0100000011111101 

1000000011111110 

假设 要 求 一 个 纠 错 编码 可 以 校正 长 度 为 10 的 存储 器 字 的 全 部 单位 错误 ， 那 么 ， 

a) 需要 有 多 少 位 奇偶 校 验 位 ? 

b) 如 果 采 用 本 章 介绍 的 海 明 算法 来 设计 纠 错 编 码 ， 请 求 出 10 位 信息 字 : 1001100110 的 编码 字 。 


5. 假设 正在 使 用 的 一 种 纠 错 编 码 可 以 校正 长 度 为 7 的 存储 器 字 的 全 部 单位 错误 。 计 算 结 果 表 明 ， 需 要 4 


位 校 验 位 ， 编 码 字 的 全 部 长 度 为 11 位 。 编 码 字 的 产生 方式 是 采用 书 中 所 介绍 的 海 明 算 法 。 现 在 接收 器 
收 到 如 下 代码 字 : 

10101011110 

假定 采用 偶 校 验 ， 请 问 收 到 的 这 个 字 是 否 为 合法 的 编码 字 ? 如 果 不 是 ， 根 据 纠 错 编码 ， 指 出 错误 发 生 
在 哪 一 位 ? 


. 使 用 下 面 的 代码 字 ， 重 复 练习 35: 


01111010101 
列举 里 德 -所 罗 门 编码 与 海 明 编 码 两 种 不 同 之 处 的 名 称 。 

何 时 需要 选择 采用 一 个 CRC 编码 而 不 是 海 明 编码 ? 何 时 需要 采用 海 明 编 码 而 不 是 CRC 编码 ? 
. 对 于 下 列 的 模 2 除法 运算 ， 求 出 商 和 余数 : 

@a) 1010111: 二 1101， 
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全 b) 1011111;: 二 11101， 

Gc) 1011001101, 二 10101， 

争 d) 111010111; +10111; 

对 于 下 列 的 模 2 除法 运算 ， 求 出 商 和 余数 ， 

a) 1111010s 二 1011， 

b) 1010101; 一 1100， 

c) 1101101011; 10101; 

d) 1111101011; 二 101101， 

使 用 CRC 多 项 式 1011， 计 算 信息 字 : 1011001 的 CRC 编码 字 。 在 接收 端 进行 除法 校 验 。 

使 用 CRC 多 项 式 1011， 计 算 信息 字 : 01001101 的 CRC 编码 字 。 在 接收 端 进 行 除 法 校 验 。 

任意 挑选 一 种 计算 机 结构 (例如 ，80486、Pentium、Pentium IV、SPARC、Alpha 或 者 是 MIPS) 。 试 研 
究 一 下 所 选 的 结构 与 本 章 所 引入 的 各 种 基本 概念 有 何 关联 。 比 如 ， 对 负数 系统 采用 什么 表示 方法 ? 而 
系统 支持 什么 字符 编码 ? 





我 永远 都 热爱 布尔 代数 的 世界 。 


- -Claude Shannon 


第 3 章 布尔 代数 和 数字 逻辑 
3.1 概述 


在 阿 伯 拉 军 ' 林肯 〈Abraham Lincoln) 担任 美国 总 统 的 时 代 ， 乔 治 . 布尔 (George Boole) 正 生 活 
在 英格兰 。 布 尔 是 一 位 数学 家 和 逻辑 学 家 ， 他 发 明了 一 种 采用 代数 体系 来 表达 逻辑 过 程 的 方法 。 这 种 
方法 后 来 发 展 成 为 数学 的 一 门 分 支 学 科 ， 称 为 符号 逻辑 学 (symbolic logic)，, 或 布尔 代数 (Boolean al- 
gebra) 。 后 来 ，John Vincent Atanasoff 将 布尔 代数 应 用 于 数学 计算 。 当 时 ，Atanasoff 正在 试图 利用 
Pascal 和 Babbage 采用 的 技术 来 建造 一 台 计 算 机 器 ， 用 于 求解 线形 代数 方程 。 在 经 历 了 多 次 失败 以 后 ， 
Atanasoff 有 些 泪 丧 。 于 是 ， 他 决定 驾车 外 出 。 当 他 突然 意识 过 来 时 ， 发 现 自 己 已 经 到 了 远离 他 的 居住 
地 Iowa 州 的 Ames 镇 200 英里 以 外 的 了 inois 州 。 

Atanasoff 并 没有 打算 开车 到 这 么 远 的 地 方 。 当 时 ， 在 Illinois 州 可 以 合法 地 在 酒店 买 酒 喝 。 于 是 ， 
他 便 走 进 一 家 小 酒店 坐 了 下 来 ， 要 了 一 杯 波 旁 威士忌 酒 。 他 发 现 自 己 开车 这 么 远 ， 只 是 为 了 喝 一 杯 酒 。 
作者 个 人 并 不 以 为 是 这 杯 酒 才 使 Atanasoff 有 了 后 来 的 灵感 ， 事 实 上 他 根本 就 没有 喝 那 杯 酒 。 凭 借 深 厚 
的 物理 和 数学 功底 ， 他 通过 对 过 去 失败 的 计算 机 器 的 反思 ，Atanasoff 在 计算 机 器 的 新 设计 方案 中 做 出 
了 四 个 关键 性 的 突破 。 

他 决定 采用 电动 方法 来 取代 机 械 运动 的 方法 。 当 时 ， 使 用 真空 电子 管 就 可 以 实现 。 

因为 要 使 用 电动 方法 ， 所 以 Atanasoff 决定 采用 基数 为 2 的 数 制 来 代替 基数 10 的 计数 体系 。 这 样 ， 
基数 2 可 以 直接 与 电学 开关 的 “ 开 ” 或 “ 关 ” 的 状态 相关 联 。 这 种 构想 导致 了 后 来 发 展 的 计算 机 系统 
是 数字 计算 机 ， 而 不 是 模拟 计算 机 。 

他 同时 使 用 电容 器 作为 存储 器 。 因 为 电容 器 可 以 储存 电荷 ， 并 且 可 以 通过 一 个 再 生 过 程 来 避免 电 
荷 泄露 。 

对 于 计算 方法 ，Atanasoff 将 采用 他 称 为 “直接 逻辑 操作 ”的 方法 ， 而 不 是 以 前 的 各 种 计算 机 器 所 
使 用 的 枚 举 计 数 的 计算 方法 。 这 种 方法 在 本 质 上 就 是 布尔 代数 。 

要 知道 Atanasoff 在 当时 并 没有 意识 到 他 在 解决 问题 时 应 用 了 布尔 代数 ， 而 是 经 过 反复 试验 ， 自 己 
发 明了 直接 逻辑 操作 方法 。 他 当时 并 不 清楚 早 在 1938 年 ，Claude Shannon 已 经 证 明了 2 值 的 布尔 代数 
可 以 描述 2 值 的 电学 开关 电路 的 操作 。 今 天 ， 人 们 都 了 解 布尔 代数 在 现代 计算 机 系统 设计 中 的 重要 性 。 
因此 ， 本 书 将 用 一 章 内 容 来 讨论 布尔 逻辑 ， 以 及 布尔 代数 与 数字 计算 机 的 相互 关系 。 

本 章 内 容 包括 逻辑 设计 的 简要 介绍 ， 布 尔 代 数 的 基本 知识 ， 以 及 布尔 代数 与 各 种 多 辑 门 和 基本 数 
字 电 路 中 的 关系 。 也 许 读者 已 经 从 以 前 的 编程 经 验 中 熟悉 了 一 些 基 本 的 布尔 算 符 。 因 此 ， 更 详细 地 学 
习 有 关 布 尔 代 数 的 内 容 显得 很 有 必要 。 在 本 章 中 ,读者 将 会 看 到 布尔 逻辑 和 计算 机 系统 中 的 实际 物理 
部 件 之 间 有 着 密切 的 联系 。 然 而 ， 作 为 一 位 计算 机 科学 家 ， 也 许 从 来 都 不 会 有 机 会 设计 数字 电路 或 者 
其 他 的 物理 部 件 。 事 实 上 ， 本 章 也 不 是 为 设计 这 些 内 容 而 准备 的 ， 只 是 希望 读者 可 以 具备 足够 的 基本 
知识 ， 来 了 解 隐藏 在 计算 机 设计 和 具体 实现 中 的 一 些 基 本 动机 和 缘由 。 如 果 理 解 了 布尔 远 辑 是 如 何 影 
响 各 种 计算 机 部 件 的 设计 ， 我 们 就 可 以 从 编程 的 角度 更 有 效 地 使 用 各 种 不 同 的 计算 机 系统 。 本 章 的 结 
尾 还 列 出 了 许多 有 关 的 资料 ， 有 兴趣 的 读者 可 以 对 相关 的 问题 做 更 深入 的 探讨 。 | 


3.2 布尔 代数 
布尔 代数 处 理 的 对 象 只 能 取 两 个 值 ， 如 典型 的 例子 是 ， 对 与 错 (或 称 为 真 与 假 )。 当 然 ， 布 尔 代数 
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的 对 象 可 以 是 任意 的 一 对 数值 。 由 于 计算 机 是 由 一 组 或 者 处 于 “ 开 ” 态 ， 或 者 处 于 “ 关 ” 态 的 电子 开 
关 构成 ， 所 以 利用 布尔 代数 来 表示 数字 信息 是 一 件 非常 自然 的 事情 。 实 际 上 ， 数 字 电路 是 利用 高 低 电 压 
来 表示 各 种 数字 信息 ， 可 以 简单 地 理解 为 1 和 0。 人们 通常 的 解释 是 ， 数 字 1 代表 真 ， 数 字 0 代表 假 。 


3.2.1 布尔 表达 式 


除了 表示 这 些 三 进 制 的 对 象 外 ， 布尔 代数 还 可 以 对 这 些 对 象 ， 或 称 为 变量 ， 进 行 操作 运算 。 将 变 
量 和 算 符 组 合 在 一 起 就 构成 了 布尔 表达 式 (Boolean expression) 。 布 尔 函 数 〈Boolean function) 一 般 有 
一 个 或 多 个 输入 值 ， 基 于 这 些 输入 值 而 产生 的 一 个 操作 结果 : 或 者 是 0， 或 者 是 1 。 
表 3-1 AND 的 真 值 表 


常用 的 布尔 算 符 有 : AND、OR 和 NOT。 为 了 更 好 地 理解 布尔 算 
符 ， 可 以 采用 下 面 的 方法 来 研究 各 个 算 符 的 行为 :即将 所 有 的 输入 值 ， 
及 其 各 种 组 合 列 成 表 ， 并 给 出 算 符 操作 所 得 到 的 对 应 结果 。 这 个 表 称 为 
真 值 表 (truth table) 。 对 于 特定 的 算 符 或 函数 ， 真 值 表 采 用 表格 的 形式 
来 表示 其 输入 值 与 作用 于 这 些 输 入 变量 所 产生 的 结果 之 间 的 对 应 关系 。 
真 值 表 可 以 完整 地 描述 一 个 布尔 算 符 的 行为 。 下 面 ， 分 别 采用 布尔 代数 
和 真 值 表 来 表示 布尔 算 符 : AND、OR 和 NOT 。 

逻辑 算 符 AND ( 称 为 “与 ?) 可 以 采用 一 个 圆 点 来 表示 ， 或 者 中 间 
无 符号 。 例 如 ， 布尔 表达 式 zy 和 表达 式 zx 。>y 是 等 效 的 ， 读 作 “ 与 
y” 表达 式 zy 也 常常 被 称 为 布尔 积 (Boolean product) 。 当 然 ， 也 利用 
真 值 表 来 表示 的 AND 算 符 的 行为 特性 ， 如 表 3-1 所 示 。 

可 见 ， 只 有 当 两 个 输入 值 都 为 1 时 ， 表 达 式 zy 的 结果 才 等 于 1; 而 对 
于 其 他 的 输入 值 ， 其 结果 都 是 0。 表 中 的 每 一 行 代表 了 一 个 不 同 的 布尔 表达 
式 。 并 且 ， 所 有 zx 和 yy 值 的 各 种 可 能 组 合 都 分 列 在 真 值 表 的 不 同行 中 。 

布尔 算 符 OR， 通 常 使 用 加 号 来 表示 。 因 此 ， 表 达 式 zx 十 y 读 为 “x 
或 y” 只 有 当 输 入 都 为 0 时 ，z 十 y 的 结果 才 为 0， 而 其 他 结果 都 是 1。 
表达 式 zx 十 y 通常 也 被 称 为 布尔 和 (Boolean sum)。OR 的 真 值 表 如 表 
3-2 所 示 。 

逻辑 算 符 NOT， 通 常用 上 划 线 或 单 引 号 来 表示 。 因 此 ,和 xz” 读 
作 “ 非 zx ”NOT 的 真 值 表 如 表 3-3 所 示 。 

















显然 ， 布 尔 代数 处 理 的 是 二 进 制 变量 和 相关 的 逻辑 运算 。 下 面 讨论 将 多 个 布尔 变量 和 多 个 逻辑 算 


符 组 合 在 一 起 构成 布尔 表达 式 的 情形 。 例 如 ， 布 尔 函数 : 
F(zyyyz) 一 工 十 yz 


就 是 一 个 包含 布尔 变量 z、y 和 z 以 及 逻辑 算 符 “” 表 3-4 F (x, y, 2z) 三 x 十 yz 的 真 值 表 


AND、OR 和 NOT 的 布尔 表达 式 。 其 中 到 底 首 先 
执行 哪 一 个 算 符 呢 ? 布尔 算 符 运算 的 顺序 规则 是 : 
NOT 为 最 高 优先 级 ， 首 先 执行 ， 其 次 是 AND， 
然后 为 OR 算 符 。 这 样 ， 上 面 的 函数 下 的 运算 过 
程 为 ， 先 对 y 进行 “ 非 ” 操 作 取 “ 反 ”， 然 后 执行 
y 和 >z 的 “与 ”操作 ,得 到 的 结果 最 后 和 工 一 起 
完成 “或 ”操作 。 

同样 ， 也 可 以 采用 真 值 表 来 表示 这 个 表达 式 。 
生成 真 值 表 的 形式 对 于 表示 类 似 这 样 的 一 些 更 复 





杂 的 函数 很 有 帮助 。 0 直到 获得 最 终结 果 


为 止 。 函 数 的 真 值 表 如 表 3-4 所 示 ，。 
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真 值 表 的 最 后 一 列 给 出 了 函数 下 对 应 于 各 种 z+、y 和 xz 组 合 的 结果 。 实 际 上 ， 函 数 下 的 真 值 表 只 
是 由 表 的 前 三 列 和 最 后 一 列 构成 。 表 中 划 阴 影 部 分 的 列表 示 的 是 要 求 出 最 后 结果 所 需要 的 中 间 步 又 。 
按 这 种 方式 生成 真 值 表 ， 可 以 使 各 种 复杂 表达 式 的 计算 变 得 更 容易 。 


3.2.2 布尔 恒等式 


布尔 表达 式 常 常 不 是 以 最 简单 的 形式 出 现 。 回 忆 一 下 代数 中 情形 ， 表 达 式 2z 十 6z 就 不 是 最 简单 
的 表达 式 ， 可 以 将 其 化 简 为 8z。 布 尔 表 3-5 布尔 代数 的 基本 恒等式 
表达 式 也 可 以 进行 类 似 的 化 简 。 布 尔 “时 3 ) 
代数 有 自己 的 一 些 恒等式 (identity)， 
或 称 为 定律 。 这 些 恒等式 可 以 作用 于 da 
单个 布尔 变量 或 者 是 布尔 表达 式 ， 现 
列 于 表 3-5。 表 中 的 每 个 定律 (最 后 
一 个 除外 ) 都 有 AND ( 积 ) 和 OR 
(和 ) 两 种 形式 ， 这 种 规律 称 为 对 偶 原 
理 (duality principle) 。 

一 致 律 所 表示 的 是 任 一 布尔 变 
量 “ 与 ”1 操作 和 “或 ”0 操作 ， 其 
结果 还 是 原来 的 变量 值 (对 “与 ?操作 来 说 ，1 是 恒 等 元 素 ; 而 对 “或 ”操作 ，0 是 恒 等 元 素 )。 零 律 则 
表示 任意 布尔 变量 “与 ”0 结果 为 0， 而 “或 ”1 的 结果 为 1。 寡 等 律 说 明 一 个 变量 和 变量 自身 的 “与 ” 
和 “或 ”操作 结果 还 为 原来 的 变量 值 。 互 补 律 则 说 明了 一 个 变量 与 其 反 码 的 “与 ”操作 和 “或 ”操作 
产生 结果 分 别 为 0 和 1 的 恒等式 。 结 合 律 和 交换 律 与 普通 代数 相同 ， 布 尔 变量 可 以 通过 相互 交换 来 重 
新 排序 ， 改 变 结合 来 重新 分 组 ， 而 不 会 影响 最 终 的 结果 。 分 配 律 则 是 表示 如 何 把 “或 ”操作 转化 为 
“与 ”操作 ， 或 者 是 反 过 来 把 “与 ”转换 成 “或 ”操作 。 

吸收 律 和 德 摩根 律 的 关系 看 起 来 并 不 是 十 分 明显 ， 
我 们 可 以 采用 真 值 表 来 对 这 些 等 式 进行 证 明 。 如 果 这 些 
等 式 左右 两 边 的 表达 式 相等 ， 那 么 这 些 表 达 式 就 应 该 有 
相同 的 真 值 表 。 表 3-6 表示 “与 ”形式 的 德 摩根 律 等 式 
左右 两 边 函 数 的 真 值 表 。 其 他 定律 的 证 明 ， 如 “或 ” 形 
式 的 德 摩根 律 以 及 吸收 定律 ， 留 给 读者 作为 一 个 练习 。 

还 原 律 所 说 明 的 是 两 次 取 反 结果 被 还 原 的 思想 ， 这 种 情况 在 高 中 课程 中 就 已 经 熟悉 。 还 原 律 无 论 
在 数字 电路 还 是 在 人 们 的 日 常生 活 中 都 很 重要 。 例 如 ， 如 果 用 z 表示 你 所 拥有 的 现金 数量 〈 假 定 为 正 
值 )。 如 果 现 金 被 借 走 ， 就 用 xz 表示。 当 一 个 不 值得 你 信任 的 熟人 来 向 你 借 些 现金 时 ， 你 可 以 诚实 地 告 
诉 他 手头 没有 钱 。 因 为 ，z=《〈z)， 即 使 借 走 的 现金 刚刚 还 回来 了 。 

初学 者 在 进行 布尔 逻辑 运算 时 ， 常 犯 的 一 个 错误 是 认为 : (zy) =zy。 这 实际 上 不 是 一 个 正确 的 等 式 。 
从 德 摩根 律 可 以 清楚 地 看 出 这 种 运算 的 错误 。 但 是 ， 这 的 确 是 一 个 非常 容易 犯 的 错误 ， 应 该 注意 避免 。 


3.2.3 布尔 表达 式 的 化 简 


在 代数 学 中 ， 可 以 利用 代数 恒等式 来 对 一 些 方 程式 进行 化 简 。 例如， 可 以 把 表达 式 10z 十 2y 一 工 十 
3y 化 简 为 最 简化 的 形式 〈9z 十 5y) 。 类 似 地 ， 布 尔 恒等式 也 同样 可 以 用 来 对 布尔 方程 式 进行 化 简 。 下 
面 是 一 些 应 用 举例 。 

例 3-1 假定 函数 F(z，y) = zy 十 xy。 利用 “或 ”形式 的 寡 等 律 ， 将 方程 式 中 的 zy 当 作 一 个 单 
一 布尔 变量 。 原 来 的 表达 式 被 化 简 为 zy。 结果 为 : 下 (z，?y) zy 十 zy 一 Zy。 | 

例 3-2 已 知 函 数 (z,y,z) 二 zyz 十 Tyz 十 Tz ， 化 简 过 程 如 下 : 

















了 了 一 工 











xrt=0 


TX (zi+y) 一 工 












(Zz 十 y) 十 z= 二 x 十 (y 十 z) 
I (y+z) =zy+zz 







Xzxy=z 





(xy) 一 工 十 y (z+y) 一 Zy 
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F(zyyyz) 一 并 yz 十 工 yZ 十 工 z 

一 zy(z 十 z) 十 zz (分 配 律 ) 

一 Zy(1) 十 zx (互补 律 ) 

=Zxy 二 xz (一 致 律 ) EE 
通常 ， 化 简 过 程 直截了当 ， 就 如 同 例 3-2 所 示 。 然 而 ， 有 时 化 简 过 程 中 恒等式 的 运用 需要 一 些 技 


巧 ， 如 例 3-3 所 示 。 
例 3-3 已 知 函数 FE (Crz，>，z) 一 zy 十 zz 十 yz， 化 简 如 下 : 
=zxy 二 zz 十 yz(1) (一 致 律 ) 
二 zy 十 Zz 十 yz(z 十 x) (互补 律 ) 
一 zy 十 zz 十 (yz)Z 十 (yz) 并 (分 配 律 ) 
二 zy 十 Zz 十 ZX(yz) 十 ZX(zy) (交换 律 ) 
一 Zy 十 zz 十 (zy)z 十 (zz)y (结合 律 ) 
一 Zy 十 (zy)z 十 zz 十 (zz)y (交换 律 ) 
二 zy(1 十 z) 十 Xz(1 十 y) (分 配 律 ) 
一 zy(1) 十 zz(1) ( 零 律 ) 
一 Zy 十 zz (一 致 律 ) | 


例 3-3 所 证 明 的 就 是 大 家 熟知 的 一 致 性 理论 (Consensus Theorem)。 

有 时 需要 在 表达 式 中 插 人 一 些 项 来 简化 布尔 函数 。 这 是 一 个 技巧 性 问题 ， 没 有 通用 的 法 则 ,只 有 
通过 不 断 练 习 才 能 熟练 掌握 布尔 代数 的 化 简 表 3-7 应 用 恒等式 的 例子 
过 程 。 当 然 ， 还 有 其 他 一 些 方法 可 以 用 来 化 3 
简 布 尔 方程 式 ， 这 将 在 以 后 的 章节 中 介绍 。 (z+y) (z+y) 王立 十 zy 十 并 十 yy 

同样 ， 可 以 利用 这 些 布 尔 恒等式 来 证 明 一 0 十 zy 十 yZ 十 ?yy 














布尔 等 式 。 例 如 ， 要 证 明 等 式 (z 十 y)(z 十 y) 二 0 十 Zy 十 yz 十 y 短 等 律 
二 y， 证 明 过 程 如 表 3-7 所 示 。 =zy+yz+y 一 致 委 
要 证 明 两 个 布尔 表达 式 相 等 ， 可 以 分 别 =y (z+z) +y 分 配 律 《和 交换 律 ) 
生成 两 个 真 值 表 ， 然 后 进行 比较 。 如 果真 什 = 《4D ty 互补 律 
表 相同 ， 那 么 表达 式 也 相等 。 作 为 一 个 练习 ， 2 一 致 律 
读者 可 以 利用 真 值 表 来 证 明 表 3-7 中 的 等 式 。 人 
3.2.4 反 码 


如 例 3-1 所 示 ， 布 尔 恒等式 可 以 应 用 于 布尔 表达 式 ， 而 不 仅仅 是 布尔 变量 (如 例子 中 将 zy 当 作 单 
一 布尔 变量 ， 然 后 应 用 短 等 律 )。 这 一 点 对 于 布尔 算 符 来 说 也 是 相同 的 。 最 常用 的 布尔 算 符 是 NOT 算 
符 ， 可 以 应 用 于 更 复杂 的 布尔 方程 式 ， 生 成 该 表达 式 的 反 码 (complement) 。 后 面 读者 可 以 看 到 布尔 函 
数 与 其 采用 电子 线路 组 成 的 物理 实现 之 间 存 在 着 一 一 对 应 关系 。 在 多 数 情况 下 ， 从 电路 上 实现 一 
数 的 反 码 要 比 实现 函数 本 身 简 单 和 经 济 一 些 。 要 实现 反 码 功能 ， 必 须 对 原 函 数 的 输出 结果 进行 取 反 操 
作 。 这 只 需 简单 地 实施 一 个 NOT 操作 。 在 数字 系统 中 ， 反 码 是 非常 有 用 的 。 

可 以 使 用 德 摩根 律 ， 来 对 一 个 布尔 函数 进行 取 反 , 求 出 其 反 码 。“ 或 ”形式 的 德 摩根 律 为 (zx 十 y) 一 
zy。 可 以 很 方便 地 将 该 定律 推广 到 3 个 或 更 多 变量 的 情形 。 已 知 以 下 函数 : 

F(z,y,z)= (zy 十 z) 

设 ww 一 (z 十 y)， 则 有 : 

F(x,y,z)= (wz) =wz 

现在 ， 再 应 用 德 摩根 律 ， 得 到 : 

wz= (ZX y)z=Zxyz=F(r,y,z) 
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因此 ， 如 果 F(z,y,z)= 二 (xz 十 y 十 z)， 则 有 F(z,y,z) 二 zyz。 应 用 对 偶 原理 ,不 难得 出 (xyz) 二 十 
y 十 zs 

很 显然 ， 求 布尔 表达 式 的 反 码 ， 只 需 简单 地 用 其 反 码 取代 各 个 变量 (如 用 z 取代 xz)， 并 且 将 表达 
式 中 的 “与 ”操作 和 “或 ”操作 互 换 。 这 正 表 3-8 一 个 布尔 函数 及 其 反 码 的 真 值 表 
是 德 摩根 律 所 阐述 的 。 例 如 ， 函 数 z 十 yz 的 3 
反 码 为 x(y 十 z)。 注 意 ， 要 加 上 适当 的 括 
号 ， 以 确保 运算 次 序 的 正确 性 。 

这 是 一 条 求 布尔 表达 式 的 反 码 的 简单 经 
验 法 则 ， 可 以 通过 比较 表达 式 与 其 反 码 的 真 
值 表 来 验证 这 种 方法 的 正确 性 。 利 用 真 值 表 
表示 反 码 时 ， 要 注意 原 表达 式 输出 值 为 0 
处 ， 对 应 的 反 码 输出 应 该 为 1; 而 原 表达 式 
输出 为 1 的 地 方 ， 反 码 输出 则 对 应 为 0。 表 
3-8 为 函数 (x,y,z) 二 十 yz 及 其 反 码 
F(z,y,z) 二 zx(y 十 z) 的 真 值 表 。 阴 影 部 分 分 
别 表示 下 和 F 的 最 终结 果 。 


3.2.5 布尔 函数 的 表示 方法 


对 于 一 个 已 知 的 布尔 函数 ， 可 以 有 多 种 表示 方法 。 例 如 ， 可 使 用 真 值 表 ， 或 者 众多 不 同 的 布尔 表 
达 式 中 的 某 一 个 来 表示 。 实 际 上 ， 布 尔 函 数 可 以 有 无 限 多 个 不 同 的 布尔 表达 式 ， 它 们 在 逻辑 上 都 是 相 
互 等 效 的 〈logically equivalent) ， 人 参见 例 3-4。 

例 3-4 ， 如果 已 知 F(z,y*z) 一 z 十 zy。 很 显然 ， 在 形式 上 也 可 以 用 F(x,y,z) 二 x 十 x 十 zy 来 表示 下。 
因为 军 等 律 已 经 证 明了 这 两 个 表达 式 的 结果 是 一 样 的 。 同 样 ， 利 用 分 配 律 也 可 以 将 下 表示 为 F(z,y,z) 二 
ZX(1 十 y) 的 形式 。 | 

为 了 减 小 可 能 带 来 的 混淆 ， 人 逻辑 设计 人 员 一 般 使 用 一 种 规范 (canonical) 形式 ,或 称 为 标准 化 
(standardized) 形式 来 描述 特定 的 布尔 函数 。 对 于 任意 的 布尔 函数 ， 都 存在 某 个 唯一 的 标准 化 形式 。 
然而 ,不 同 的 设计 人 员 可 以 使 用 不 同 的 “标准 化 ”形式 。 最 通用 的 两 种 标准 化 形式 是 积 之 和 的 形式 ， 
以 及 和 之 积 的 形式 。 

积 之 和 形式 (sum-of-products form) 是 将 表达 式 先 写成 一 些 变量 “与 ”项 (乘积 项 ) 的 集合 ， 然 
后 再 利用 “或 ”形式 组 合 在 一 起 。 例 如 ， 函 数 Pi Cz,y,z) 一 zy 十 yz 十 zyz 就 是 积 之 和 的 形式 。 而 函数 
F(z ,ysz) 二 zy 十 ZCy 十 Zz) 则 不 是 积 之 和 形式 。 当 然 ， 可 以 利用 分 配 律 来 展开 Fz 函数 中 的 括号 项 ,使 
表达 式 变化 为 zy 十 zy 十 zz， 这 就 是 一 个 积 之 和 形式 。 

布尔 表达 式 也 可 以 表示 为 和 之 积 (product-of-sums) 形式 。 和 之 积 的 形式 就 是 将 表达 式 先 写成 各 
变量 的 “或 ”项 〈 求 和 项 ) 然后 用 “与 ”的 形式 组 合 在 一 起 。 例 如 ， 函 数 Fi(zx,y,z) 二 (x 十 y) (x 十 z) 
(y 十 z)(y 十 z) 就 是 采用 和 之 积 的 形式 。 一 般 来 说 ， 如 果 表 达 式 中 估 值 为 真 的 情形 多 于 估 值 为 假 时 ， 可 
选用 和 之 积 的 形式 。 函 数 Fi 不 属于 这 类 情况 ， 所 以 选择 积 之 和 的 形式 是 合适 的 。 同 时 ， 积 之 和 的 形式 
也 较 易 处 理 和 简化 。 因 此 ， 在 下 面部 分 的 介绍 中 采用 这 种 积 之 和 的 形式 。 

任何 一 个 布尔 表达 式 都 可 以 表示 为 积 之 和 的 形式 。 因 为 任意 一 个 布尔 表达 式 也 可 以 表示 为 真 值 表 
的 形式 ， 所 以 任意 一 个 真 值 表 也 同样 可 以 表示 为 积 之 和 的 形式 。 事 实 上 ， 可 以 非常 方便 地 将 真 值 表 转 
化 为 积 之 和 的 表示 形式 ， 如 下 例 所 示 。 

例 3-5 考虑 一 个 简单 的 择 多 函数 。 已 知 函数 有 3 个 输入 。 如 果 少 于 一 半 的 输入 为 1， 输 出 就 为 0; 
如 果 至 少 一 半 的 输入 为 1， 则 输出 也 为 1。 表 3-9 为 3 个 输入 的 择 多 函数 的 真 值 表 。 国 
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为 了 将 真 值 表 转 换 为 积 之 和 的 形式 ， 首 先 从 反 过 程 来 考虑 这 一 问题 .如 果 要 使 表达 式 z 十 y 等 于 
1， 那 么 或 者 y 中 至 少 有 一 个 (或 者 两 个 ) 等 于 1。 而 表 3-9 择 多 函数 的 真 值 表 表 示 法 
如 果 要 zy 十 yz 二 1， 则 要 求 或 者 zy 一 1, 或 者 yz 一 1 (或 | | a 
者 两 者 都 等 于 1)。 反 过 来 使 用 这 一 人 逻辑 ， 并 将 其 应 用 于 
例 3-5 中 。 可 以 发 现 ， 如 果 z= 二 0，y 二 1 和 z==1 时 ， 范 
数 的 输出 肯定 是 1。 满 足 这 一 关系 的 乘积 项 为 x-yz (很 显 
然 ， 当 z=0，y==1 和 z=1 时 ， 该 乘积 项 等 于 1)。 第 二 
个 输出 为 1 的 情形 为 ，z=1，y=0 和 zx 王 1， 对 应 的 乘积 
项 是 zyz。 第 三 个 乘积 项 是 zyz， 而 最 后 一 个 乘积 项 为 
ZXyz。 归 纳 起 来 ， 要 利用 真 值 表 生 成 积 之 和 的 表达 式 ， 就 
是 找到 真 值 表 中 输出 值 为 1 的 对 应 行 ， 将 该 行 的 输入 变量 写成 积 的 形式 。 在 生成 的 每 个 乘积 项 中 ， 都 
必须 将 输入 为 0 的 变量 取 反 。 

这 样 ， 择 多 函数 可 以 按照 积 之 和 的 形式 表示 为 : F(z,y,z) 一 yz 十 zyz 十 zyZ 十 zyz。 注 意 ， 这 一 
表达 式 可 能 不 是 最 简单 的 形式 。 但 是 ， 它 一 定 是 一 个 标准 形式 。 在 表示 布尔 函数 时 ， 积 之 和 的 标准 形 
式 与 和 之 积 的 标准 形式 是 完全 等 价 的 。 利 用 布尔 恒等式 可 以 从 其 中 的 一 种 表示 形式 转换 成 另 一 种 表示 
形式 。 但 是 ， 无 论 是 采用 积 之 和 ， 还 是 和 之 积 的 表示 形式 ， 表 达 式 最 终 都 要 转化 成 最 简单 的 表示 形式 。 
即将 表达 式 化 简 成 最 少 的 项 。 化 简 的 理由 是 因为 布尔 表达 式 与 其 电路 的 物理 实现 之 间 存 在 着 一 一 的 对 
应 关系 ， 这 种 对 应 关系 将 在 下 面 的 章节 中 介绍 。 表 达 式 中 不 必要 的 项 ， 会 在 物理 实现 中 造成 不 必要 的 
部 件 ， 结 果 难 以 生成 理想 的 电路 。 


3.3 逻辑 门 


到 目前 为 止 ， 所 讨论 的 逻辑 算 符 AND、OR 和 NOT 都 是 一 些 使 用 真 值 表 和 布尔 表达 式 的 抽象 表 
示 。 实 际 的 物理 部 件 ， 或 者 说 数字 电路 (digital circuit) ， 例 如 计算 机 中 执行 算术 操作 或 做 出 抉择 的 部 
件 都 是 由 一 定数 目的 称 为 门 电路 〈gate) 的 最 原始 的 基本 单元 构成 的 。 这 些 门 电路 是 数字 设计 的 基本 
构件 ， 可 以 执行 前 面 所 讨论 的 各 种 基本 逻辑 功能 。 从 形式 上 来 说 ， 门 电路 是 一 个 计算 各 种 2 值 函数 的 
微小 电子 元 件 。 更 简单 地 说 ， 门 电路 执行 一 个 简单 的 布尔 逻辑 功能 。 在 物理 上 构成 一 个 门 电 路 需要 1 
到 6 个 ， 或 更 多 的 晶体 管 《 晶 体 管 已 经 在 第 1 章 中 做 了 介绍 ) ， 具 体 唱 体 管 的 数目 取决 于 所 采用 的 半 导 
体 技 术 。 归 纳 起 来 ， 计 算 机 的 基本 物理 部 件 是 晶体 管 ， 而 基本 的 逻辑 单元 是 门 电路 。 


3. 3. 1 逻辑 门 的 表示 符号 


首先 来 讨论 三 种 最 简单 的 门 电路 ， 它 们 分 别 对 应 于 逻辑 算 符 AND、OR 和 NOT。 前 面 已 经 介绍 了 
这 些 布尔 算 符 的 功能 特性 。 图 3-1 是 表示 这 些 算 符 对 应 的 门 电路 的 图 形 符 号 。 


x x 本 
Gad xX+y 
- x 
学 » 


与 门 (AND) 或 门 (OR) 非 门 NOT) 
图 3-1 三 种 基本 门 电路 
注意 ， 非 门 的 输出 端 有 一 个 圆圈 。 通 常 ， 这 种 圆圈 表示 取 反 ( 非 〉 操 作 。 
另外 一 个 常用 的 门 电路 是 异 或 〈exclusive<OR，XOR) 门 ， 采 用 布尔 表达 式 表 示 为 : zx 四 y。 如 果 
两 个 输入 值 相 等 ，XOR 输出 为 假 (0);， 否则 输出 为 真 (1)。 图 3-2 是 说 明 XOR 功能 行为 的 真 值 表 和 
逻辑 图 形 符号 。 
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b) 异 或 门 (XOR) 的 逻辑 符号 
图 3-2 异 或 门 
3.3.2 通用 门 电 路 


其 他 两 个 常用 的 门 电路 是 与 非 门 (NAND) 和 或 非 门 (NOR)， 它 们 分 别 生成 与 门 和 或 门 的 反 码 
输出 。 这 里 ， 每 种 门 电路 都 可 以 采用 两 种 不 同 的 逻辑 符号 来 表示 〈 作 为 一 个 练习 ， 读 者 可 以 证 明 这 两 
种 符号 表示 在 逻辑 上 是 等 价 的 ， 提 示 : 使 用 德 摩根 律 )。 图 3-3 和 图 3-4 分 别 表示 与 非 门 和 或 非 门 的 逻 


辑 符号 图 ， 以 及 与 每 种 逻辑 门 的 功能 行为 相对 应 的 真 值 表 。 


图 3-3 与 非 门 (NAND) 的 真 值 表 和 逻辑 符号 


和 (X77) 王 = (X77) 
人 , 了 


图 3-4 或 非 门 (NOR) 的 真 值 表 和 逻辑 符号 


与 非 门 通常 也 称 为 万 能 门 (universal gate) ， 因 为 只 要 使 用 与 非 门 就 可 以 构建 所 有 的 数字 电路 。 为 
了 证 明 这 一 点 ， 图 3-5 给 出 了 仅 采用 与 非 门 组 成 的 与 门 、 或 门 和 非 门 。 








( 副 )= 效 





与 门 (AND) 或 门 (OR) 非 门 (NOT) 
图 3-5” 仅 采用 与 非 门 构建 的 三 种 数字 电路 


读者 也 许 会 问 ， 为 什么 不 简单 地 采用 已 经 熟知 的 与 门 、 或 门 和 非 门 ， 而 要 使 用 单一 与 非 门 来 构建 
各 种 数字 电路 呢 ? 事实 上 有 两 个 理由 : 第 一 , 使 用 与 非 门 的 电路 成 本 比较 低 。 第 二 ， 在 物理 上 构建 复 
杂 的 集成 电路 (这些 内 容 将 在 后 面 的 章节 中 讨论 ) 时 ,使 用 相同 的 结构 模块 (比如 ， 几 个 与 非 门 ) 常 
常 比 使 用 一 些 基 本 结构 模块 的 集合 〈 例 如， 一 些 与 门 、 或 门 和 非 门 的 组 合 ) 要 容易 得 多 。 

对 偶 原理 同样 也 适用 于 这 种 通用 性 规则 。 这 样 ， 可 以 使 用 或 非 门 来 构建 任意 的 数字 电路 。 正 如 前 面 所 
述 ， 与 非 门 和 或 非 门 之 间 是 相互 关联 的 。 在 逻辑 上 ， 它 们 分 别 对 应 于 积 之 和 与 和 之 积 的 表现 形式 。 这 就 是 
说 ， 积 之 和 形式 的 布尔 表达 式 可 以 采用 与 非 门 来 实现 ， 而 和 之 积 的 表示 形式 则 可 以 使 用 或 非 门 来 实现 。 


3.3.3 多 输入 的 门 电路 
到 目前 为 止 ， 所 有 讨论 的 门 电路 都 只 有 两 个 输入 端 。 显 然 ， 门 电路 的 输入 值 可 以 多 于 两 个 。 不 同 
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的 门 电路 可 以 有 不 同 数目 和 种 类 的 输入 和 输出 方式 。 例 如 ， 这 里 使 用 一 个 三 输入 的 或 门 来 表示 布尔 表 
达 式 : x 十 y 十 z， 如 图 3-6 所 示 。 

而 图 3-7 表示 的 是 表达 式 zyz。 

在 本 章 的 后 面部 分 ， 读 者 可 以 看 到 ， 数 字 电路 中 通常 会 将 门 电路 的 输出 端 用 符号 Q 来 表示 ， 而 同 
时 也 将 输出 的 反 码 Q 在 图 形 符 号 中 表示 出 来 。 这 种 图 形 表示 法 有 时 很 有 用 。 如 图 3-8 所 示 。 


XT+YVY+2 区 2 ” 0 
了 
过 了 6 
3- 


Ne 


图 3-6 一 个 三 输入 的 或 图 3-7 ”一 个 三 输入 的 与 站 图 3-8 共有 两 个 输入 和 
门 表 示 x 十 yz 表示 zyz 两 个 输出 的 与 门 
图 形 符号 
3.4 数字 电路 元 件 


打开 一 台 计 算 机 ， 可 以 发 现 计 算 机 系统 由 大 量 数字 电路 元 件 组 成 。 组 成 计算 机 的 大 量 的 门 电路 通 
过 导线 连接 ， 这 些 导 线 构成 了 系统 的 信号 通路 。 这 些 门 电路 的 集合 常常 是 一 些 非常 标准 的 电路 。 这 些 
标准 电路 组 成 一 系列 的 基本 结构 模块 ， 可 以 用 来 构建 整个 计算 机 系统 。 令 人 惊讶 的 是 ， 这 些 结构 模块 
全 部 采用 基本 的 “与 “或 ”和 “ 非 ” 操 作 来 构建 的 。 在 接 下 来 的 部 分 ， 我 们 将 讨论 各 种 数字 电路 ， 
这 些 数 字 电路 与 布尔 代数 的 相互 关系 ， 各 种 标准 结构 模块 ， 以 及 利用 这 些 结构 模块 来 构建 两 种 不 同类 
型 的 数字 电路 例子 ， 组 合 逻 辑 电路 和 时 序 逻 辑 电 路 。 


3.4.1 数字 电路 及 其 与 布尔 代数 的 相互 关系 


到 底 布尔 函数 和 数字 电路 之 间 存 在 着 什么 联系 昵 ? 从 前 面 的 讨论 可 知 ， 一 个 简单 的 布尔 操作 〈 比 
如 ,“ 与 ”操作 或 者 是 “或 ”操作 ) 可 以 用 一 个 简单 的 逻辑 门 电路 表示 。 各 种 复杂 的 布尔 表达 式 可 以 表 
示 为 一 些 “ 与 ” 门 、“ 或 ” 门 和 “ 非 ” 门 的 组 合 形式 ， 结 果 也 就 是 描述 整个 布尔 表达 式 的 逻辑 图 。 这 种 
逻辑 图 实际 上 代表 的 是 特定 的 布尔 表达 式 的 一 种 物理 实现 ， 即 真实 的 数字 电路 。 现 在 来 考虑 前 面 提 到 
的 函数 F(z,y,z)= 一 z 十 yz。 图 3-9 表示 了 实现 这 个 函数 的 一 个 逻辑 图 。 





图 3-9 F(xr,y,z) 二 x 十 yz 的 逻辑 图 

很 明显 ， 对 于 任何 布尔 表达 式 都 可 以 建立 其 逻辑 图 ， 而 由 逻辑 图 可 以 实现 数字 电路 。 

利用 布尔 代数 可 以 分 析 和 设计 各 种 数字 电路 。 央 为 布尔 代数 和 逻辑 图 之 间 存 在 着 相互 对 应 的 关系 ， 
所 以 通过 化 简 布 尔 表 达 式 可 实现 简化 电路 的 目的 。 各 种 数字 电路 都 是 通过 门 电 路 来 实现 的 。 但是， 在 
设计 层次 上 ， 逻 辑 门 和 逻辑 图 并 不 是 表示 数字 电路 的 最 方便 的 形式 。 这 一 层次 上 ， 更 好 的 选择 是 使 用 
布尔 表达 式 ， 因 为 布尔 表达 式 更 容易 处 理 和 化 简 。 

布尔 函数 的 表达 式 的 复杂 性 将 直接 影响 到 实现 布尔 函数 的 数字 电路 的 复杂 程度 。 布 尔 表达 式 越 复 
杂 ， 其 实现 的 数字 电路 也 越 复杂 。 应 该 指出 的 是 ， 简 化 电路 时 并 不 一 定 要 使 用 布尔 恒等式 。 从 前 面 的 
介绍 可 知 ， 使 用 布尔 恒等式 来 化 简 电 路 有 时 是 很 困难 和 非常 费时 的 。 内 此， 设计 人 员 通 常 采用 一 种 更 
加 自动 化 的 方法 来 完成 函数 的 化 简 工 作 。 这 种 方法 就 是 使 用 卡 诺 图 (Karnaugh maps， 或 Kmaps) 的 
方法 。 感 兴趣 的 读者 可 以 参考 本 章 后 面 的 专题 内 容 ， 了 解 如 何 利 用 卡 诺 图 来 帮助 化 简 数 字 电路 。 
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3.4.2 集成 电路 


计算 机 由 各 种 数字 电路 元 件 构 成 ， 这 些 元 件 通过 导线 连接 在 一 起 。 就 像 一 个 好 的 程序 一 样 ， 实 际 
的 计算 机 硬件 由 一 些 较 大 的 数字 电路 模块 组 成 。 而 这 些 电 路 模块 是 一 些 基 本 门 电路 的 组 合 ， 不 同 的 结 
构 模 块 执 行 不 同 的 功能 。 生 成 这 些 “ 结 构 模 块 ” 所 需 的 门 电路 的 数目 取决 于 所 采用 的 制造 技术 。 因 为 
电路 制造 技术 不 属于 本 书 的 内 容 ， 读 者 可 以 参阅 本 章 后 面 的 文献 资料 ， 了 解 更 多 有 关 电 路 制造 技术 方 
面 的 知识 。 

通常 ， 门 电路 并 不 单独 销售 ， 而 是 以 集成 电路 (integrated circuits，IC) 的 形式 出 现 。 集 成 电路 芯 
片 〈 一 块 小 的 半导体 硅 单 唱片 ) 上 面 集成 了 各 种 电子 元 件 (晶体 管 、 电 阻 和 电容 )， 用 来 实现 各 种 门 电 
路 的 功能 。 正 如 第 1 章 所 述 ， 集 成 电路 中 的 电子 元 件 是 直接 在 半导体 芯片 上 腐蚀 制 成 。 因 此 ， 与 对 等 
的 分 立 器 件 相 比 ， 集 成 电路 上 的 元 件 的 体积 更 小 ， 工 作 时 消耗 的 电能 更 少 。 这 种 芯片 封装 在 有 外 接管 
脚 的 陶瓷 或 塑料 的 包装 中 。 利 用 焊接 引线 连接 芯片 和 外 部 的 管 脚 ， 完 成 集成 电路 制造 。 早 期 的 集成 电 
路 包含 的 晶体 管 数目 比较 少 ， 称 为 小 规模 集成 电路 〈SSI) 。 一 般 每 块 芯 片上 不 到 100 个 晶体 管 。 现 在 
使 用 的 是 超大 规模 集成 电路 〈ULSID) ， 每 块 芯片 上 的 电子 元 件数 目 超 过 一 百 万 个 。 图 3-10 是 一 个 小 规 
模 集成 电路 的 示意 图 。 


oz 同 同 同 同 同 辐 
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图 3-10 一 个 简单 的 小 规模 集成 电路 〈SSD) 


3.5 组 合 逻 辑 电 路 


电路 是 由 数字 钦 辑 芯片 组 合 而 成 的 。 这 些 逻 辑 电路 可 分 为 组 合 逻 辑 和 时 序 逻 辑 。 本 节 介 绍 组 合 逻 
辑 ， 时 序 逻 辑 将 在 第 3. 6 节 介 绍 。 


3.5.1 基本 概念 


可 以 利用 组 合 逻 辑 来 构建 包含 基本 布尔 算 符 、 输 入 和 输出 的 数字 电路 。 了 解 组 合 逻 辑 的 关键 是 组 
合 逻 辑 的 输出 完全 取决 于 所 给 定 的 输入 值 。 因 此 ， 组 合 逻辑 电路 的 输出 是 输入 值 的 函数 ， 并 且 任 意 时 
刻 的 输出 值 都 是 由 该 时 刻 的 输入 值 叭 一 确定 的 。 一 个 组 合 逻辑 电路 可 能 会 有 几 个 输出 。 这 种 情况 下 ， 
每 个 输出 都 代表 了 一 个 不 同 的 布尔 函数 。 


3.5.2 典型 的 组 合 还 辑 电路 | 
首先 讨论 一 个 称 为 “ 半 加 器 (half-adder)” 的 非常 简单 的 组 合 逻 辑 电路 。 下 面 考虑 两 个 二 进 制 数 
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字 相 加 的 问题 。 这 里 只 有 三 种 可 能 的 运算 : 0 十 0 二 0,， 0 十 1==1 十 0 二 1 和 1 十 1 二 10。 大 家 非常 清楚 这 种 
电路 的 行为 状态 ， 并 可 以 将 电路 的 行为 特性 用 真 值 表 的 形式 表示 出 来 。 这 里 需要 指出 的 是 ， 半 加 器 有 
两 个 输出 ， 而 不是 一 个 。 因 为 需要 其 中 一 个 输出 表示 求 和 结果 ， 另 外 一 个 输出 表示 进位 。 半 加 器 的 真 
值 表 如 表 3-10 所 示 。 

仔细 观察 ， 可 以 发 现 求 和 操作 实际 上 是 运算 一 个 或 非 函 数 (XOR) 。 而 进位 输出 等 效 于 一 个 “与 ” 
(AND) 门 的 输出 。 将 一 个 “或 非 ” 门 和 一 个 “与 ”组 合 在 一 起 ， 就 得 到 了 半 加 器 的 逻辑 图 ， 如 图 3-11 


所 示 。 
求 和 
表 3-10 半 加 器 的 真 值 表 y 









进位 
3-11 半 加 器 的 逻辑 图 


半 加 器 是 一 个 非常 简单 的 数字 电路 ,但 并 不 是 很 实用 。 原 因 是 半 加 器 只 能 对 两 个 一 位 的 二 进 制 数 
字 进 行 相 加 。 当 然 ， 可 以 对 半 加 器 进行 扩充 ， 使 其 电路 能 够 完成 较 大 的 二 进 制 数字 的 加 法 运算 。 例 如 ， 
考虑 十 进 制 数 的 加 法 : 先 对 最 右边 一 列 相 加 ， 即 个 位 数字 相 加 ， 进 位 加 到 十 位 上 ， 如 此 类 推 。 我 们 使 
用 相同 的 方法 ,执行 二 进 制 数字 的 加 法 运算 。 因 此 ， 这 个 加 法 电路 需要 有 三 个 输入 ‘zx、y 和 进位 输 
入 ) 和 两 个 输出 ( 求 和 结果 和 进位 输出 )。 图 3-12 表示 一 个 全 加 器 (full-adder) 的 真 值 表 和 对 应 的 逻 
辑 图 。 不 难看 出 ， 全 加 器 由 两 个 半 加 器 和 一 个 “或 ” 门 组 成 。 


| 进位 输入 


De 
水 


进位 输出 
a) 全 加 器 的 真 值 表 b) 全 加 器 的 逻辑 图 
3-12 全 加 器 的 真 值 表 对 应 的 逻辑 图 


读者 也 许 会 奇怪 ， 这 样 一 个 全 加 器 电路 如 何 对 二 进 制 数 进行 相 加 ， 因 为 它 只 能 加 三 位 。 事实 上 ， 
这 个 电路 的 确 不 能 完成 多 位 数字 的 运算 。 但 是 ， 只 需 将 上 面 的 加 法 器 电路 复制 16 次 ， 就 可 以 构建 一 个 
16 位 字 的 全 加 器 。 具 体 做 法 是 ， 将 每 个 单一 加 法 器 电路 的 进位 输出 端 连接 到 相 邻 左边 的 加 法 器 的 进位 
输入 端 ， 如 图 3-13 所 示 。 这 种 结构 的 电路 称 为 逐 位 进位 加 法 器 (ripple-carry adder)， 因为 产生 的 进位 
是 按 顺序 逐 位 通过 各 个 加 法 器 。 注 意 ， 图 中 没有 画 出 构成 加 法 器 的 所 有 门 电路 ， 而 是 采用 一 个 黑金 子 
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(black box) 来 代表 加 法 器 。 采 用 黑 盒子 的 方式 可 以 忽略 实际 门 电路 的 细节 ， 而 只 需 关 心 电 路 的 输入 和 
输出 。 对 大 多 数 数字 电路 来 说 ， 包 括 后 面 马 上 要 介绍 的 译 码 器 、 多 路 复 用 器 和 加 法 器 等 ， 采 用 黑 盒 子 
表示 法 是 一 种 常用 方法 。 


Ys Xs 六 A Yo Xo 


进位 输出 Cis C2 Ci Co 
~ 


图 3-13” 逐 位 进位 加 法 器 的 逻辑 图 

因为 这 种 逐 位 进位 加 法 器 的 运算 速度 非常 慢 ， 所 以 现实 中 不 会 采用 这 种 方法 来 实现 加 法 运算 。 但 
是 ， 这 种 加 法 器 的 原理 很 简单 ， 有 助 于 理解 如 何 实现 较 大 的 二 进 制 数字 的 加 法 运算 。 加 法 器 设计 中 采 
用 的 各 种 改进 方法 包括 : 使 用 先行 进位 加 法 器 、 选 择 进 位 加 法 器 和 存储 进位 加 法 器 ， 以 及 其 他 一 些 方 
法 。 各 种 改进 方法 的 目的 都 是 要 缩短 由 于 两 个 二 进 制 数字 相 加 的 逐 位 进位 过 程 所 造成 的 延迟 时 间 。 事 
实 上 ， 这 些 改进 设计 的 新 加 法 器 通过 实行 并 行 加 法 操作 和 减 小 最 大 进位 路 径 的 方法 ， 可 以 获得 比 逐 位 
进位 加 法 器 快 410%--90% 的 速度 。 加 法 器 是 一 个 非常 重要 的 电路 。 如 果 不 能 进行 数字 加 法 运算 ， 计 算 
机 就 会 变 得 毫 无 用 处 。 另 外 ， 各 种 计算 机 都 需要 频繁 使 用 的 译 码 操 作 也 同样 非常 重要 。 译 码 器 是 从 一 
组 ”个 输入 得 到 最 大 的 2" 个 输出 ， 从 而 实现 对 二 进 制 信息 的 解码 。 译 码 器 (decoder) 通过 利用 输入 和 
对 应 的 数值 来 选择 某 根 特定 的 输出 线 。“ 选 择 一 根 输出 线 ” 是 什么 意思 ? 这 就 意味 着 只 有 唯一 的 一 根 输 
出 线 被 断言 ， 或 者 说 被 设置 成 1， 而 其 他 输出 线 都 被 设置 为 0。 译 码 器 通常 采用 输入 和 输出 的 数目 来 定 
义 。 例 如 ， 一 个 3 输入 和 8 输出 的 译 码 器 称 为 3-8 译 码 器 。 

上 面 提 到 译 码 器 是 各 种 计算 机 中 都 需要 频繁 使 用 的 部 件 。 关 于 这 一 点 ， 读 者 可 能 知道 许多 计算 机 
中 必须 执行 的 算术 操作 ， 但 却 发 现 很 难 举 出 一 个 译 码 器 的 例子 来 。 如 果 是 这 种 情况 ,读者 肯定 对 计算 
机 访问 存储 器 的 原理 不 太 熟 悉 。 

计算 机 中 的 所 有 存储 器 地 址 都 是 采用 二 进 制 数字 来 指定 分 配 的 。 当 需要 引用 某 个 存储 器 地 址 时 
(也 许 是 要 读 吏 数据， 也许 是 为 了 写 人 数据 ) ， 计 算 机 必须 首先 确定 该 存储 器 的 有 效 〈 实 ) 地址 。 这 个 
操作 需要 利用 译 码 器 来 完成 。 下 面 将 举例 说 明 有 关 译 码 器 工作 原理 的 各 种 问题 和 它 的 基本 用 途 。 

例 3-6 一 个 3-8 译 码 器 

假设 某 个 存储 器 由 8 片 存储 芯片 组 成 ， 每 片 可 以 存储 8K 字 节 的 信息 。 假 定编 号 为 0 的 芯片 0 的 存 
储 器 地 址 为 0--8191， 汞 片 1 的 地 址 为 8192--16383， 其 他 如 此 类 扒 。 共 有 8KX 8=64K (65，536) 存 
储 器 地 址 。 现 在 并 不 需要 将 所 有 64K 地 址 都 用 二 进 制 数 写 出 来 ， 而 是 只 有 少数 地 址 采用 二 进 制 的 形式 
编写 (有 关 这 一 点 ， 下 面 将 会 详细 说 明 )， 这 样 就 可 以 解释 为 什么 需要 一 个 译 码 器 。 

显然 ，64 一 26，1K 一 210 ，64K 一 26 X210 二 216 ， 要 表示 64K 地 址 的 每 一 位 需要 16 位 二 进 制 数 。 如 
果 一 时 难于 理解 的 话 ， 可 以 先 来 看 一 些 较 小 的 地 址 数值 。 例 如 ， 现 在 有 4 个 地 址 一 一 地 址 0、1、2 和 
3， 与 这 些 地 址 对 应 的 等 效 二 进 制 编码 数 分 别 为 00、01、10 和 11。 也 就 是 说 ， 表 示 4 个 地 址 只 需要 2 
位 数字 ， 因 为 22 一 4。 同 样 ， 如 果 考 虑 8 个 地 址 ， 从 0 到 7。 如 果 用 二 进 制 数 来 编号 的 话 ， 需 要 几 位 数 
字 ? 答案 是 3 位， 因为 8=23。 大 家 可 以 很 方便 地 把 这 8 个 地 址 写 出 来 。 显然 ，2 的 短 指 数 就 是 表示 地 
址 所 需要 的 最 小 二 进 制 数 的 位 数 。 . 

现在 回 到 原来 的 问题 ， 芯 片 0 上 所 有 的 地 址 的 格式 都 为 : 000xrzrrrrrrxztrrrr。 由 于 芯片 0 包含 
的 地 址 范围 是 08192， 因此 这 些 地 址 所 对 应 的 二 进 制 数位 于 000000000000000 一 
0001111111111111 的 范围 内 。 类 似 地 ， 芯 片 1 上 的 地 址 格式 是 ;001r+xrrrrxrxzxrrr7， 其 他 的 芯片 
也 按 此 法 类 推 。 很 明显 ， 地 址 编码 中 最 左边 的 3 位 二 进 制 数 表示 每 个 芯片 所 处 的 位 置 。 对 于 整个 存 
储 器 系统 ， 需 要 16 位 地 址 来 进行 编码 。 但 是 ， 对 于 每 个 存储 器 芯片 来 说 ， 只 有 2 个 地 址 。 所 以 ， 
在 某 个 芯片 内 部 ， 只 需要 13 位 二 进 制 数 就 可 以 唯一 地 确定 每 个 地 址 的 位 置 。 这 也 正 是 最 右边 的 13 
位 二 进 制 数字 所 代表 的 信息 。 
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当 计 算 机 进行 寻 址 操作 时 ， 首 先 要 确定 使 用 的 是 哪个 芯片 ， 然 后 青 在 指定 的 芯片 内 找 出 实际 的 地 
址 。 在 本 例 中 ,计算机 使 用 最 左边 的 3 位 二 进 制 数 来 选择 存储 器 芯片 ， 用 余下 的 13 位 在 所 选 定 的 芯片 
内 部 进行 寻 址 。 这 3 个 高 位 实际 上 会 被 用 作 译 码 器 的 输入 ， 计 算 机 将 通过 译 码 器 来 选 通 所 要 访问 的 存 
储 器 芯片 。 如 果 前 面 的 3 位 为 000， 那 么 就 是 芯片 0 被 选 通 。 如 果 前 面 的 3 位 为 111， 芯 片 7 会 被 选 通 。 
如 果 前 面 的 3 位 数 是 010， 那 么 又 是 哪个 芯片 被 选中 ? 显然 是 芯片 2。 只 要 开启 连通 某 条 特定 的 导线 就 
可 以 选 通 某 个 存储 器 芯片 。 译 码 器 的 一 个 输出 就 是 用 来 激活 一 个 芯片 ， 也 只 是 连通 唯一 的 一 个 由 编码 
地 址 指定 的 存储 器 芯片 。 本 

图 3-14 表示 的 是 一 个 译 码 器 的 物理 电路 构成 和 译 码 器 的 表示 符号 。 第 3. 6 节 将 介绍 译 码 器 在 存储 
器 系统 中 的 使 用 方法 。 
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. 译 码 器 
nn 输入 : 2" 输 出 
一 一 一 
a) 一 个 译 码 器 的 内 部 结构 b) 译 码 器 的 表示 符号 


图 3-14 译 码 器 的 内 部 结构 及 其 表示 符号 
另外 一 个 常用 的 组 合 罗 辑 电路 是 多 路 复 用 器 (multiplexer)。 多 路 复 用 器 用 来 从 众多 的 输入 线 中 选 
择 需 要 的 二 进 制 数 的 信息 ， 然 后 直接 用 单一 输出 线 输出 。 多 路 复 用 器 通过 一 组 选择 变量 ,或 称 为 控制 
线 ， 来 控制 选 定 某 个 特定 的 输入 线 。 在 每 个 特定 的 时 刻 ， 都 只 有 一 个 输入 〈 被 选中 的 输入 ) 可 以 通过 
线路 连通 到 输出 端 ， 而 所 有 其 他 的 输入 都 会 被 断 开 。 如 果 控 制 线 上 的 变量 数值 发 生变 化 ， 那 么 连通 到 
输出 端的 实际 输入 线 也 会 随 之 发 生 改 变 。 图 3-15 给 出 了 一 个 多 路 复 用 器 的 物理 电路 构成 和 多 路 复 用 器 
的 表示 符号 。 
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图 3-15 多 路 复 用 器 的 内 部 结构 及 其 表示 符号 
在 什么 情况 下 我 们 会 使 用 多 路 复 用 器 呢 ? 分 时 共享 的 计算 机 就 是 使 用 多 路 复 用 器 的 输入 连接 多 个 
用 户 使 用 终端 。 调 制 解 调 器 网 络 〈Modem pools) 也 是 使 用 多 路 复 用 器 将 来 自 Modem 的 各 个 线路 输入 
到 计算 机 系统 。 


布尔 代数 和 激 字 到 故 Va 


另外 一 个 非常 有 用 的 组 合 电路 是 奇偶 发 生 器 和 奇偶 校 验 器 电路 〈 读 者 可 以 参阅 第 2 章 所 介绍 的 奇 
偶 校 验 的 内 容 )。 奇 偶发 生 器 (parity generator) 电路 可 以 生成 所 需 ” 表 3-11 奇偶 发 生 器 的 真 值 表 
要 的 奇偶 位 加 到 一 个 信息 字 上 面 ， 而 奇偶 校 验 器 (parity checker) 校 验 位 
是 用 来 检验 一 个 信息 字 中 的 奇偶 性 〈 奇 或 者 偶 ) 是 否 正确 。 如 果 奇 
偶 位 有 误 ， 则 表示 检测 到 一 个 奇偶 错误 。 

典型 的 奇偶 发 生 器 和 奇偶 校 验 器 采用 “或 非 ” 函 数 构成 。 假 定 
采用 的 是 奇 校 验 ，3 位 字 的 奇偶 发 生 器 真 值 表 如 表 3-11 所 示 。 而 4 
位 字 (3 位 信息 位 和 1 位 奇偶 校 验 位 ) 的 奇偶 校 验 器 的 真 值 表 如 表 
3-12 所 示 。 如 果 检 测 到 一 个 错误 ， 奇 偶 校 验 器 的 输出 为 1; 否则 ， 输 
出 为 0。 对 应 的 奇偶 发 生 器 和 奇偶 校 验 器 的 逻辑 图 留 给 读者 作为 一 
个 练习 。 












表 3-12 奇偶 校 验 器 的 真 值 表 
























































组 合 逻辑 电路 的 例子 很 多 ， 如 比较 器 、 移 位 电路 和 可 编程 逻辑 器 件 等 ， 都 是 一 些 非常 有 用 的 组 合 
数字 电路 ， 而 且 很 容易 理解 。 由 于 篇 幅 的 缘故 ， 在 此 不 再 一 一 列举 。 感 兴趣 的 读者 可 以 参阅 本 章 后 面 
有 关 组 合 迎 辑 电 路 的 参考 文献 。 在 结束 组 合 逻辑 电路 的 话题 之 前 ， 还 要 介绍 一 个 很 重要 的 组 合 逻 辑 电 
路 一 算术 逻辑 单元 (arithmetic logic unit，ALU)。 至 此 ， 我们 已 经 学 习 了 构建 算术 逻辑 单元 所 需 的 所 
有 部 件 。 | 

图 3316 是 一 个 非常 简单 的 ALU 逻辑 图 .这 个 ALU 可 以 执行 4 种 基本 操作 : “与 ”、“ 或 ”、 
“ 非 ” 和 加 法 。 加 法 运算 的 操作 数 是 两 个 2 位 的 机 器 字 。 利 用 两 条 控制 线 ，fo 和 万 来 确定 CPU 要 
执行 的 是 何 种 操作 。 信号 00 表示 加 法 运算 (A 十 B); 01 是 NOTA; 10 为 A OR B; 而 11 则 是 A 
AND B。 输 入 线 Ao 和 Al 表示 其 中 一 个 机 器 字 的 2 位 二 进 制 ， 而 Be 和 Bi 表示 第 二 个 字 。Co 和 Cl 
则 是 输出 线 。 
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图 3-16 一 个 简单 的 2 位 ALU 


3.6 时序 电 路 


上 面 讨 论 的 是 组 合 逻 辑 电路 。 研 究 组 合 逻辑 电路 的 方法 是 分 析 布 尔 函 数 中 各 个 变量 与 对 应 的 函数 
值 之 间 的 关系 。 对 于 组 合 逻 辑 电 路 ， 函 数 的 输出 值 完全 取决 于 函数 的 输入 值 。 如 果 输 入 值 发 后 变化 ， 
则 立即 会 对 输出 值 产生 直接 影响 。 组 合 逻 辑 电 路 的 最 大 缺点 是 没有 存储 的 概念 ， 即 组 合 逻 辑 电路 没有 
记忆 功能 。 显 然 ， 组 合 逻 辑 电 路 在 解决 记忆 问题 的 方面 存在 困难 ， 而 大 家 知道 计算 机 需要 有 基 种 方法 
记忆 各 种 数值 。 即 使 一 个 soda 机 〈 投 币 饮料 机 ) 中 的 一 个 非常 简单 的 数字 电路 ， 也 需要 有 记忆 功能 。 
当 硬 币 投入 机 器 中 ， 电 路 必须 记忆 每 次 投 币 的 数量 。 没 有 这 种 记忆 能 力 ， 机 器 很 难 使 用 。 央 此 ， 仅 用 
组 合 逻 辑 电路 是 不 能 建造 soda 机 的 。 要 了 解 soda 机 的 工作 过 程 ， 从 而 最 终 能 够 理解 计算 机 的 工作 原 
理 ， 必 须 学 习 时 序 逻 辑 电路 。 


3.6.1 基本 概念 


时 序 逻 辑 电 路 的 定义 是 ， 时 序 电路 的 输出 同时 是 当前 的 输入 与 以 前 的 输入 的 函数 。 因 此 ， 时 序 电 
路 的 输出 与 以 前 的 输入 状态 有 关 。 为 了 记忆 前 面 的 输入 ， 时 序 电路 必须 具有 某 种 类 型 的 存储 单元 。 通 
常 ， 将 时 序 电路 中 的 这 种 存储 单元 称 为 触发 器 (flip-flop)。 触 发 器 的 状态 是 此 前 的 电路 输入 的 函数 。 
内 此 ， 即 将 发 生 的 输出 不 但 与 当前 的 输入 有 关 ， 而 且 与 电路 当前 的 状态 有 关 。 大 家 知道 ， 组 合 逻 辑 电 
路 是 各 种 门 电路 的 综合 。 同 样 ， 时 序 逻 辑 电 路 是 各 种 触发 器 的 综合 。 
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3. 6.2 时 钟 信 号 


在 讨论 时 序 电路 之 前 ， 先 介绍 一 下 对 事件 进行 排序 的 方法 。 因 为 时 序 电 路 必须 依赖 过 去 的 输入 来 
决定 现在 的 输出 ， 这 意味 着 各 种 事件 的 发 生 必 须 有 先后 次 序 。 有 些 时 序 电路 是 异步 的 〈asyn- 
chronous)， 这 就 是 说 只 要 有 任意 的 一 个 输入 值 发 生 改 变 ， 这 类 电路 就 被 激活 了 。 同 步 《synchronous) 
时 序 有 逻辑 电路 则 是 利用 时 钟 来 对 各 种 事件 进行 排序 。 时 钟 (clock) 是 一 种 电子 电路 ， 它 生成 一 系列 有 具 
有 精确 宽度 和 间隔 的 连续 脉冲 。 脉 冲 间 隔 称 为 时 钟 的 周期 时 间 (clock cycle time)。 时 钟 速 度 一 般 用 兆 
赫兹 《MHz)， 或 者 说 每 秒 钟 百 万 个 时 钟 脉冲 。 一 般 的 时 钟 周期 在 1 到 几 百 MHz 的 范围 。 

时 序 电路 使 用 时 钟 来 确定 何 时 出 新 电路 的 状态 〈 也 就 是 何 时 将 “现在 ”的 输入 变 成 “过 去 ”的 输 
人 人 ?)。 这 意味 着 电路 的 输入 只 能 在 一 些 特定 的 分 立时 刻 影响 时 序 电路 的 存储 单元 。 本 章 主要 讨论 同步 
时 序 电 路 ， 因 为 与 异步 时 序 电路 相 比 ， 同 步 时 序 电 路 更 容易 理解 。 从 这 个 意义 说 ， 本 书后 面 提 到 “时 
序 电 路 ”是 指 “同步 时 序 逻 辑 电路 ”。 

大 部 分 时 序 电 路 是 采用 边缘 触发 的 〈 另 外 ， 还 有 水 平 -触发 电路 ) ， 也 就 是 电路 的 状态 或 者 在 时 钟 
脉冲 的 上 升 边缘 或 者 是 在 时 钟 脉冲 的 下 降 边 缘 发 生 改变 ， 如 图 3-17 所 示 。 


高 低 


下 降 边缘 





图 3-17 时 钟 脉冲 信号 示意 图 
3.6.3 触发 器 


水 平 触发 电路 只 要 时 钟 信 号 处 于 高 电 平 或 低 电 平时 ， 就 可 以 改变 电路 的 状态 。 有 时 ， 人 们 常常 会 
混淆 锁 存 器 〈latch) 和 触发 器 〈flip-flop) 的 这 两 个 名 称 。 从 技术 上 来 说 ， 锁 存 器 属于 水 平 触发 类 型 ， 
而 触发 器 则 是 边缘 触发 类 型 的 电路 。 本 书 将 使 用 触发 器 这 一 名 称 。 

为 了 “记忆 ”过 去 的 状态 ， 时 序 电路 使 用 了 一 个 称 为 反馈 〈feedback) 的 概念 。 反 馈 就 是 将 电路 的 
输出 返回 连接 到 电路 的 输入 端 。 一 个 双 非 门 组 成 的 简单 反馈 电路 如 图 3-18 所 示 。 

在 这 个 图 中 ， 如 果 输 出 Q 为 0， 就 会 一 直 为 0。 如果 输出 Q 为 1， 就 一 直 为 1。 显然 ， 这 个 电路 不 
是 非常 有 用 ， 也 没有 技术 上 的 兴趣 ， 但 有 助 于 理解 反馈 的 工作 原理 。 

一 个 更 有 用 的 反馈 电路 由 是 由 两 个 “与 非 ” 门 组 成 的 基本 存储 单元 ， 称 为 SR 触发 器 (SR flip- 
flop)。SR 表示 “ 置 位 /复位 (set/reset)”， 其 逻辑 图 如 图 3-19 所 示 。 





图 3-18 简单 反馈 电路 的 例子 图 3-19 SR 触发 器 的 逻辑 图 


我 们 可 以 使 用 所 谓 特征 表 (characteristic table) 来 描述 触发 器 ， 特 征 表 是 基于 电路 的 输入 和 当前 
的 状态 Q 指出 电路 的 下 一 个 状态 。 一 般 采 用 符号 Q(t) 表示 电路 当前 的 状态 ，Q (t 十 1) 表 示 电 路 的 下 一 个 
状态 ， 或 者 说 当时 钟 脉 冲 到 来 时 ， 触 发 器 应 该 进入 的 状态 。 图 3-20 表示 一 个 SR 触发 器 的 物理 电路 的 实现 和 
特征 表 。 - 
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a) 一 个 实际 的 SR 触发 器 b) SR 触发 器 的 特征 表 
图 3-20 SR 触发 器 


SR 触发 器 的 工作 特性 是 很 令 人 感 兴趣 的 。SR 触发 器 有 三 个 输入 : S、R 和 当前 的 输出 Q(t)。 表 
3-13 为 SR 触发 器 的 真 值 表 ， 可 以 说 明 其 工作 原理 。 

例如 ， 如 果 S 为 0，R 为 0， 且 当前 的 状态 QCO) 为 0， 那 么 下 一 “ 表 3-13 SR 触发 器 的 真 值 表 
个 状态 Q(t 十 1) 也 是 0; 如 果 S 为 0, R 为 0, 且 QD) 为 1, 那么 了 FE 
Q(t 十 1) 为 1。 当 (S,R) 的 实际 输入 为 (0,0) 时 ， 时 钟 脉冲 不 会 引起 输 
出 状态 的 变化 。 与 此 类 似 ， 如 果 输 入 (S,R)= 二 (0,1)， 则 下 一 个 状态 
Q(z 十 1) 为 0， 而 与 当前 的 状态 无 关 ( 即 电路 的 输出 被 强制 复位 ， 
reset)。 当 (S,R) 二 (1,0) 时 ， 电 路 的 输出 被 置 位 (set) 为 1。 

如 果 S 和 R 同时 为 1， 这 种 特殊 的 触发 器 会 是 什么 状态 呢 ” 应 
该 是 强制 Q 和 Q 同时 为 0, 但 Q=0=Q?， 这 种 情况 显然 是 不 可 能 
的 。 这 样 会 导致 一 种 不 稳定 的 电路 状态 。 因 此 ， 对 SR 触发 器 来 说 ， 
输入 S 和 R 同时 为 1 的 组 合 是 不 允许 的 。 

如 果 我 们 对 SR 触发 器 设置 某 些 条 件 逻 辑 上 的 限制 ， 就 可 以 防 
止 上 面 的 非法 状态 发 生 。 对 RS 触发 器 做 如 图 3-21 所 示 的 简单 修改 ,构成 了 一 个 JK 触发 器 (JK flip- 
flop)。JK 触发 器 是 以 Texas 仪器 公司 的 工程 师 Jack Kilby 的 名 字 命 名 的 ， 他 在 1958 年 发 明了 集成 
电路 。 
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a) JK 触发 器 b) JK 触发 器 的 特征 表 c) 利用 SR 触发 器 构成 J]K 
触发 器 的 逻辑 图 





3-21 修改 RS 触发 器 


SR 触发 器 的 另外 一 种 变化 形式 是 D 触发 器 (data，D flip-flop)。D 触发 器 是 一 个 真实 的 计算 机 存 
储 器 单元 。D 触发 器 可 以 存储 一 个 信息 位 。 如 果 将 输入 设置 为 1， 那么 当时 钟 脉冲 到 来 时 ，D 触发 器 的 
输出 就 变 成 了 1; 如 果 输 入 为 0， 则 时 钟 脉冲 会 将 输出 也 变 成 为 0。 因为 输出 Q 表示 电路 的 当前 状态 ， 
所 以 输出 值 1 表示 当前 “存储 ”了 数值 1。 图 3-22 给 出 了 D 触发 器 的 表示 符号 、 特 征 表 ， 以 及 利用 SR 
触发 器 构成 D 触发 器 的 逻辑 图 。 





a) Di; 触 发 器 b) D 触发 器 的 特征 表 c) 利用 SR 触发 器 构成 卫 
触发 器 的 逻辑 图 
图 3-22 了 D 触发 器 的 表示 符号 、 特 征 表 以 及 利用 SR 构成 的 逻辑 图 
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3.6.4 典型 的 时 序 逻 辑 电路 


利用 锁 存 器 和 触发 器 可 以 实现 许多 复杂 的 时 序 逻 辑 电 路 。 寄 存 器 、 计 数 器 、 存 储 器 和 移 位 寄存 器 
都 需要 有 存储 功能 ， 所 以 都 采用 时 序 逻 辑 电 路 来 实现 。 

第 一 个 例子 是 用 4 个 DD 触发 器 来 组 成 一 个 简单 的 4 位 
寄存 器 。 当 然 ， 要 实现 较 大 的 字 的 寄存 器 ， 只 需要 简单 地 
增加 D 触发 器 的 数目 即 可 。 这 个 寄存 器 有 4 根 输 入 线 、4 根 
输出 线 和 一 根 时 钟 信号 线 。 时 钟 信号 从 定时 的 观点 来 说 是 
非常 重要 的 。 因 为 寄存 器 不 但 要 接收 全 部 的 新 输入 值 ， 同 
时 又 要 改变 寄存 器 中 各 个 存储 单元 的 状态 。 对 于 同步 时 序 
电路 ， 如 果 没 有 时 钟 脉冲 的 参与 ， 电 路 的 状态 就 不 会 发 生 
改变 。 将 4 个 相同 的 时 钟 信号 连接 到 全 部 4 个 D 触发 器 上 ， 
这 样 4 个 触发 器 可 以 同步 变化 。 图 3-23 为 这 个 4 位 寄存 器 
的 逻辑 图 和 结构 模块 图 。 在 真实 电路 中 ， 还 有 电源 线 和 接 
地 线 ， 以 及 一 根 清 0 线 ( 即 可 以 把 整个 寄存 器 的 输出 全 部 
复位 为 0)。 但 是 ， 本 书 将 把 这 些 具 体 问题 留 给 计算 机 工程 
师 ， 而 重点 介绍 这 些 电 路 的 数字 风 辑 功能 。 

另外 一 个 非常 有 用 的 时 序 电 路 是 二 进 制 计数 器 。 二 进 


Outo 


Out 


Out 


Out: 





a) 4 位 沼 
制 计数 器 会 按照 预先 设置 的 状态 ， 随 着 时 钟 脉冲 发 生 序 列 ne ow 
变化 。 对 于 标准 的 二 进 制 计 数 器 ， 这 些 状态 序列 反映 的 是 m， Rooter Out, 
二 进 制 数 的 序列 。 假 设 现 在 开始 对 二 进 制 数 进行 计数 : In, oub 
0000，0001，0010，0011，…， 不 难 发 现 ， 随 着 数字 的 增 In; Out 
加 ， 较 低位 的 每 次 变化 都 是 对 原来 数字 的 取 反 操作 。 当 计 b) 4 位 寄存 器 的 表示 模块 图 
数 器 的 某 一 位 的 状态 从 1 变 为 0 时 ， 其 相 邻 左边 的 位 就 会 变 图 3-23 4 位 寄存 器 的 逻辑 图 和 
成 原来 数字 的 反 码 。 如 果 某 个 位 右边 所 有 的 位 都 变 为 1 后 ， 结构 模块 图 


下 次 变化 就 是 使 这 个 位 的 状态 将 从 0 变 成 1。 因 为 有 对 状态 进行 取 反 的 要 求 ， 所 以 二 进 制 计数 器 最 好 
用 JK 触发 器 来 实现 。 当 J 和 K 输入 端 都 为 1 时 ， 触 发 器 的 输出 就 是 对 当前 状态 的 取 反 。 在 实际 电路 
中 ， 并 是 不 直接 将 各 独立 的 输入 连接 到 对 应 的 触发 器 ， 而 是 通过 一 根 计数 肥效 线 〈count enable line) 
连接 到 各 个 触发 器 。 只 有 当 计数 有 效 线 的 设置 为 1 时， 计数 器 才 可 以 对 到 来 的 每 个 时 钟 脉冲 进行 计数 。 
如 果 有 效 线 被 设置 为 0， 即 使 有 时 钟 脉冲 出 现 ， 计 数 器 也 不 会 改变 状态 ， 即 不 会 进行 计数 。 读者 可 以 
仔细 研究 图 3-24 所 示 的 计数 器 电路 ， 按 照 不 同 的 输入 模式 ， 跟 踪 电 路 的 每 个 状态 ， 了 解 计 数 器 的 输出 
如 何 从 二 进 制 数 0000 计数 到 1111。 还 要 特别 留意 ， 当 计数 器 的 当前 状态 为 1111 时 ， 下 一 个 时 钟 脉冲 
到 来 时 电路 将 要 进入 的 状态 。 

上 面 介绍 的 是 一 个 简单 的 寄存 器 和 一 个 计数 器 ， 下 面 要 讨论 一 个 非常 简单 的 存储 器 电路 。 

图 3-25 表示 一 个 可 以 存储 4 个 3 位 字 的 存储 器 的 逻辑 图 (通常 称 为 4X3 存储 器 ) 。 图 中 电路 的 每 
一 列 代表 一 个 3 位 的 字 。 注 意 ， 对 于 各 个 字 的 每 一 位 ， 触 发 器 都 是 通过 时 钟 控制 来 实现 同步 存储 的 。 
央 此 ， 存 储 器 的 每 次 读 或 写 , 都 是 读 写 一 个 完整 的 字 。Ino 、Ini 和 Inz 是 用 来 存储 ， 或 者 说 写 一 个 3 位 
字 到 存储 器 的 三 根 输入 线 。So 和 Si 是 两 根 地 址 线 ， 用 来 决定 存储 器 中 的 哪个 字 被 选中 。 实 际 上 ，S。o 
和 Si 是 一 个 2-4 译 码 器 的 输入 端 ， 负 责 选 择 正确 的 存储 器 字 。 三 根 输出 线 (Outo、Outi 和 Outs ) 用 
来 从 存储 器 中 读 出 各 个 字 。 

电路 还 有 另外 一 条 控制 线 ， 写 有 效 (write enable) 控制 线 用 来 决定 要 进行 的 是 读 操作 还 是 写 操 
作 。 本 电路 中 ， 输 入 线 和 输出 线 设计 成 分 开 连 接 的 形式 。 但 是 在 实际 电路 中 ， 输 入 和 输出 都 使 用 相同 
的 线路 。 
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总 结 上 面 有 关 存 储 器 电路 的 讨论 ， 将 一 个 字 写 人 到 存储 器 需要 执行 下 面 几 个 关键 步骤 : 

1. 在 So 和 Si 上 加 地 址 信号。 

2. WE ( 写 有 效 ) 设置 为 高 。 

3. 译 码 器 使 用 Se 和 Si 地 址 信和 号， 打开 一 个 “与 ” 门 ， 在 存储 器 中 选择 一 个 正确 的 字 。 

4. 在 步骤 3 中 选中 的 线路 与 时 钟 和 WE 信号 一 起 选择 一 个 字 。 

5. 对 于 选中 的 字 ， 通 过 步骤 4 中 已 经 打开 的 写 人 门 电路 加 入 时 钟 脉冲 。 

6. 在 时 钟 脉 冲 的 驱动 下 ， 输 入 线 上 的 字 被 装 人 对 应 的 三 个 D 触发 器 中 。 

对 于 读 取 操作 ， 也 可 以 列 出 类 似 的 执行 步骤 。 这 部 分 内 容留 给 读者 作为 一 个 练习 。 还 有 一 个 有 趣 
的 练习 留 给 读者 ， 就 是 对 该 电路 进行 分 析 ， 看 看 如 果 将 存储 器 从 4X3 存储 器 扩展 为 8X3 存储 器 或 者 
是 4X8 存储 器 ， 需 要 增加 哪些 额外 的 部 件 。 


3.7 电路 设计 


在 上 面 的 内 容 中 ， 引 进 了 许多 计算 机 系统 中 使 用 的 各 种 电路 部 件 。 对 此 ， 本 书 不 会 提供 读者 足够 
的 细节 来 开始 进行 计算 机 电路 和 系统 的 设计 工作 。 数 字 逻 辑 电路 设计 不 但 需要 熟悉 数字 逻辑 电路 ， 而 
且 还 要 精通 数字 分 析 (digital analysis) 一 分 析 输 出 与 输入 之 间 的 相互 关系 ; 数字 综合 (digital synthe- 
sis) 一 从 真 值 表 开始 确定 需要 实现 的 各 种 功能 的 逻辑 图 ， 以 及 CAD (计算 机 辅助 设计 ) 软件 。 从 前 面 
的 讨论 中 大 家 可 以 知道 ， 设 计 电 路 时 必须 非常 仔细 ， 以 确保 所 设计 的 电路 最 小 化 。 电 路 设计 人 员 会 面 
临 许 多 问题 ， 包 括 寻 找 最 有 效 的 布尔 函数 ， 尽 量 使 用 最 少数 量 的 门 电路 ， 采 用 一 个 不 太 昂贵 的 门 电路 
组 合 ， 合 理 组 织 电路 以 安排 满足 最 小 占有 空间 和 最 小 电能 消耗 的 要 求 ， 尽 可 能 在 设计 中 采用 标准 化 的 
功能 模块 等 等 。 当 然 ， 还 有 许多 目前 尚未 涉及 到 的 问题 ， 如 信和 号 的 传输 、 信 和 号 的 扇 出 、 信 号 同步 和 外 
部 接口 等 。 不 难 发 现 ， 数 字 电 路 设计 是 一 件 非 常 复杂 的 工作 。 

至 此 ， 我 们 已 经 讨论 了 如 何 设计 寄存 器 、 计 数 器 、 存 储 器 和 各 种 其 他 数字 电路 结构 模块 。 掌 握 了 
这 些 电 路 部 件 ， 电 路 设计 人 员 可 以 利用 硬件 来 实现 各 种 计算 机 算法 。 读者 一 定 还 记得 第 1 章 中 介绍 的 
硬件 和 软件 等 效 原 理 。 编 写 一 个 计算 机 程序 ， 也 就 是 规定 了 一 系列 的 布尔 表达 式 。 通 常 ， 编 写 一 个 程 
序 要 比 设计 一 个 实现 该 算法 的 硬件 容易 得 多 。 但 是 ， 在 许多 实际 应 用 中 ， 利 用 硬件 来 实现 的 功能 具有 
更 好 的 性 能 。 例 如 ， 在 实时 系统 中 ， 利 用 硬件 实现 比 采用 软件 实现 更 快 ， 肯 定 也 会 更 好 一 些 。 当 然 ， 
在 某 些 情形 时 ， 利 用 软件 的 功能 实现 会 更 好 一 些 。 有时， 人们 会 使 用 .个 单一 的 可 编程 的 微 处 理 器 芯 
片 来 取代 一 大 堆 数 字 电 路 部 件 。 这 样 ， 就 发 展 了 所 谓 的 嵌入 式 系统 (embedded system)。 家 庭 使 用 的 
微波 炉 和 汽车 很 可 能 使 用 了 徐 人 式 系 统 ， 其 目的 是 为 了 取代 某 些 可 能 会 引发 机 械 问题 的 附加 硬件 。 编 
程 嵌 人 式 系 统 需 要 设计 各 种 软件 。 通 过 这 些 软件 ， 艇 入 式 系统 可 以 读 出 各 个 输入 变量 ， 并 且 发 送 输出 
信号 以 执行 各 种 任务 ， 比 方 说 开关 电灯 ， 让 蜂 鸣 器 发 声 ， 发 出 一 个 警报 ， 或 者 打开 一 扇 门 。 编 写 这 些 
软件 当然 需要 了 解 布尔 函数 的 行为 法 则 。 


本 章 小 结 


本 章 的 主要 目的 是 介绍 有 关 逻 辑 设计 方面 的 基本 知识 ， 让 读者 对 构建 计算 机 系统 的 基本 电路 组 合 有 一 
个 全 面 的 了 解 。 本 章 的 学 习 不 是 为 了 使 读者 具备 设计 这 些 基本 电路 部 件 的 能 力 。 而 是 帮助 读者 更 好 地 理解 
后 面 将 要 介绍 的 有 关 体 系 结构 的 各 种 概念 。 

本 章 详细 阐述 了 标准 逻辑 算 符 AND、OR 和 NOT 的 行为 特性 和 实现 这 些 算 符 功能 的 逻辑 门 电 路 。 布 
尔 函 数 可 以 用 真 值 表 来 表示 ， 而 真 值 表 可 以 转化 为 逻辑 图 ， 逻 辑 图 则 表示 了 实现 逻辑 功能 所 需 的 数字 电路 
的 各 个 部 件 和 电路 单元 。 因 此 ， 真 值 表 提供 了 一 种 表示 布尔 函数 及 其 逻辑 电路 特性 的 方法 。 在 实际 应 用 中 ， 
就 是 将 这 些 简 单 的 逻辑 电路 组 合 构成 各 种 复杂 的 功能 部 件 ， 如 加 法 器 、 算 术 逻 辑 单元 (ALU)、 译 码 器 、 
多 路 复 用 器 、 寄 存 器 和 存储 器 等 。 

布尔 函数 与 其 数字 表示 之 间 存 在 着 一 一 对 应 关系 。 利 用 布尔 人 恒等式 可 以 化 简 布 尔 表达 式 ， 这 样 可 以 对 
组 合 数字 电路 和 时 序 腔 辑 电 路 进行 最 小 化 处 理 ， 使 电路 变 得 最 简单 。 最 小 化 处 理 在 电路 设计 中 是 非常 重要 
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的 内 容 。 从 芯片 设计 人 员 的 角度 来 说 ， 最 重要 的 两 个 因素 是 速度 和 成 本 : 电路 的 最 小 化 设计 不 但 可 以 降低 
电路 成 本 ， 而 且 有 助 于 提高 电路 的 性 能 。 

数字 逻辑 电路 分 为 两 类 ， 组 合 逻 辑 电路 和 时 序 逻 辑 电路 。 组 合 逻 辑 电路 ， 如 加 法 器 、 译 码 器 和 多 路 复 
用 器 等 ， 都 是 基于 当前 的 输入 直接 产生 输出 结果 。 逻 辑 “ 与 ” 门 、“ 或 ” 门 和 “ 非 ” 门 是 组 合 逻 辑 电 路 的 基 
本 结构 模块 。 当 然 ， 利 用 万 能 门 ， 例 如 “与 非 ” 门 和 “或 非 ” 门 ， 也 能 构建 各 种 组 合 逻辑 电路 。 时 序 逻 辑 
电路 ， 如 寄存 器 、 计 数 器 和 存储 器 等 ， 所 产生 的 输出 不 但 与 当前 输入 有 关 ， 而 且 取 决 于 电路 现在 的 状态 。 
时 序 有 逻辑 电路 采用 SR 触发 器 、D 触发 器 和 JK 触发 器 来 构建 。 

所 有 这 些 逻 辑 电路 都 是 建造 计算 机 系统 所 必须 的 基本 结构 模块 。 第 4 章 将 把 这 些 模块 组 合 在 一 起 ， 仔 
细 研 究 计算 机 的 工作 原理 。 

本 章 练习 题 后 面 有 一 篇 关于 卡 诺 图 专题 的 文章 ， 有 兴趣 的 读者 可 以 参阅 。 
深入 阅读 

大 部 分 有 关 计算 机 组 成 与 体系 结构 的 书籍 都 对 数字 逻辑 和 布尔 代数 有 简短 的 讨论 。Staliings (2000)、 
Patterson 和 Hennessy (1997) 的 著作 包含 了 数字 逻辑 的 精彩 的 概要 论述 。Mano (1993) 对 有 关 利 用 卡 诺 
图 进行 电路 简化 参见 后 面 的 专题 论述 )， 可 编程 逻辑 器 件 ， 以 及 各 种 电路 技术 做 了 很 好 的 讨论 。 如 果 需 要 
深入 了 解数 字 逻 辑 的 内 容 ， 可 以 阅读 Wakerly (2000)、Katz (1994) 或 Hayes (1993) 等 人 的 书籍 。 

要 学 习 布 尔 代 数 的 运算 技巧 ， 可 以 参阅 Gregg (1998) 的 著作 。Maxfield (1995) 的 著作 主要 讨论 了 布 
尔 逻 辑 的 各 种 细节 问题 ， 具 有 一 定 深度 ， 值 得 一 读 。 要 对 各 种 门 电路 和 触发 器 有 直接 和 简单 的 了 解 (包括 
计算 机 的 工作 原理 )， 可 以 阅读 Petgold (1989) 的 书 。Davidson (1979) 则 在 其 文章 中 叙述 了 一 种 基于 
“与 非 ” 门 构建 的 各 种 数字 电路 的 分 解 方法 〈 因 为 “与 非 ” 门 是 一 种 万 能 门 ) 。 

如 果 读 者 对 电路 的 实际 设计 有 兴趣 ， 可 以 使 用 一 个 非常 好 的 免费 仿真 器 。 这 套 工具 称 为 Chipmunk 系 
统 ， 能 够 应 用 于 非常 广泛 的 领域 ， 包 括 电 路 仿真 、 图 形 编辑 和 曲线 绘制 。 它 有 四 个 主要 工具 ， 但 是 对 于 电 
路 仿真 ，Log 就 是 所 需 的 程序 。 利 用 Log 程序 中 的 Digiog 部 分 可 以 生成 和 实际 测试 数字 电路 。 读 者 可 以 从 
网 上 下 载 ， 在 自己 的 计算 机 上 运行 。 通 用 的 Chipmunk 程序 发 布 在 网 站 www. cs. berkeley. edu/ ~ lazzaro/ 
chipmunk/ 。 这 套 仿真 工具 适合 于 许多 计算 机 平台 (包括 PC 和 Unix 机 器 ) 。 
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基本 概念 和 术语 复习 


SP 0 


上 
©O 


. 为 什么 了 解 布尔 代数 对 计算 机 科学 家 来 说 非常 重要 ? 

. 哪个 布尔 操作 被 称 为 布尔 积 ? 

. 哪个 布尔 操作 被 称 为 布尔 和 ? 

. 分 别 建立 布尔 算 符 OR、AND 和 NOT 的 真 值 表 。 

. 什么 是 布尔 对 偶 原 理 ? 

布尔 表达 式 的 最 小 化 处 理 为 什么 对 数字 电路 的 设计 至 关 重 要 ? 

. 晶体 管 与 逻辑 门 之 间 存 在 什么 相互 关系 ? 

. 列举 4 个 基本 逻辑 门 的 名 称 。 

. 本 章 中 介绍 的 是 哪 两 个 万 能 门 ? 为 什么 这 些 万 能 门 在 数字 设计 中 非常 重要 ? 
. 描述 数字 逻辑 芯片 的 基本 结构 。 

11. 
. 通过 几 个 输入 及 其 对 应 值 来 选择 某 个 特定 的 输出 线 的 电路 称 为 什么 电路 ? 举 出 这 种 电路 元 件 的 一 个 重 


描述 逐 位 进位 加 法 器 的 工作 原理 。 为 什么 现在 大 多 数 计算 机 不 采用 逐 位 进位 加 法 器 ? 


要 应 用 。 


. 什么 样 的 电路 可 以 从 一 组 多 输入 线 中 选中 二 进 制 信息 ， 并 将 其 直接 传送 给 某 条 单一 的 输出 线 ? 
. 时 序 逻 辑 电路 和 组 合 逻辑 电路 有 什么 不 同 ? 

. 构成 时 序 逻 辑 电 路 的 基本 单元 是 什么 ? 

- 如 果 讲 述 一 个 时 序 逻辑 电路 是 边缘 触发 而 不 是 水 平 触发 ， 意 味 着 什么 ? 

- 什么 是 反馈 ? 

. JK 触发 器 与 SR 触发 器 有 什么 关系 ? 

. 为 什么 电路 设计 中 通常 优先 选用 JK 触发 器 而 不 是 SR 触发 器 ? 

， 娜 种 触发 器 可 以 实际 代表 一 个 计算 机 的 存储 器 ? 


练习 题 
令 1. 构建 下 列 函数 的 真 值 表 ， 
全 a) ryz+ (Tyz) 
全 b) x (yz++zy) 
2. 构建 下 列 函 数 的 真 值 表 


a) yz 十 3 十 地 92& 
b) (z 十 y) (rz 十 z) (十 z) 
, 如果 函数 FF (z，y，z) 二 x (5 十 z)， 利 用 德 摩根 律 写 出 对 函数 下 进行 取 反 的 反 码 表达 式 。 
. 如 果 函 数 政 (x，y，z) 二 xy 十 Zz 十 yz， 利 用 德 摩根 律 写 出 对 函数 下 进行 取 反 的 反 码 表达 式 。 
. 如 果 函 数 FE (w，z，y，z) 一 xyz( 吏 十 +) 十 (zwyz 十 )， 利 用 德 摩根 律 写 出 对 函数 FF 进行 取 反 的 反 
码 表 达 式 。 
. a) 运用 布尔 恒等式 证 明 吸 收 律 。 
b) 证 明 德 摩根 律 的 正确 性 。 
. 证 明 下 面 的 分 配 律 的 正确 性 : 


ZXOR (yANDz) = (ZXORy) AND (xrXORz) 


. 利用 下 列 方法 证 明 等 式 z= 二 zy 十 xy: 
a) 真 值 表 
b) 布尔 恒等式 
. 利用 下 列 方法 证 明 等 式 zz 二 (x 十 y) (Xx 十 5) (TZ 十 z); 


a) 真 值 表 
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争 b) 布尔 恒等式 
10. 使 用 布尔 代数 和 布尔 恒等式 化 简 下 列 函 数 表达 式 ， 要 求 在 化 简 过 程 的 每 一 步 列 出 相应 的 恒等式 。 
a) F(z,y,z) 一 元 y 十 工 y 过 十 工 yZ 
b) Fl(w,z,y,z) = 〈ZT 十 Piz) (wi yz) 
c) F(x,y,z) = (zy) (z+7) 
11. 使 用 布尔 代数 和 布尔 恒等式 化 简 下 列 函数 表达 式 ， 要 求 在 化 简 过 程 的 每 一 步 列 出 相应 的 恒等式 。 
全 a) Tyz+ zz 
@b) (zt+y) (z+7) 
4c) Hy 
12. 使 用 布尔 代数 和 布尔 恒等式 化 简 下 列 函数 表达 式 ， 要 求 在 化 简 过 程 的 每 一 步 列 出 相应 的 恒等式 。 
a) (abtct+af) ef 
by wey 
c) 〈Z7 十 元 Z) (wit yz) 
让 过 使 用 布尔 代数 和 布尔 恒等式 化 简 下 列 函 数 表达 式 ， 要 求 在 化 简 过 程 的 每 一 步 列 出 相应 的 恒等式 。 
全 a) zy 十 xy 
b) 元 yz 十 zz 
c) wriw (zy yz) 
14. 使 用 任意 一 种 方法 验证 下 列表 达 式 的 正 误 : 
yz 十 工 y 过 十 元 yz 一 并 y 十 元 Z 
争 15. 利用 布尔 代数 中 的 基本 恒等式 证 明 : 
rz (T+y) 王立 y 
* 16. 利用 布尔 代数 中 的 基本 恒等式 证 明 : 
并 十 元 y 一 并 十 y 
争 17. 使 用 布尔 代数 中 的 基本 恒等式 证 明 : 
2Zy 十 元 zc 十 yz 一 并 y 十 元 < 
争 18. 下 面 为 一 个 布尔 表达 式 的 真 值 表 ， 按 照 积 之 和 的 形式 写 出 布尔 表达 式 。 


191 

















20. 画 出 以 下 函数 的 真 值 表 ， 并 按照 两 个 积 之 和 的 取 反 形式 重新 改写 布尔 表达 式 : zz 十 yz 十 zy 
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21. 已 知 函 数 F(x,y,z) 一 Ty 十 ZXyz， 

倒 a) 导出 函数 下 的 反 码 的 代数 表达 式 ， 采 用 积 之 和 的 形式 。 
b) 证 明 FF=0， 

c) 证 明 F 十 F=1。 

22. 已 知 函 数 F(x,y,z) 一 Z7z 十 元 了 z 十 工 yz 

a) 列 出 函数 下 的 真 值 表 。 

b) 画 出 原始 布尔 表达 式 的 逻辑 图 。 

c) 利用 布尔 代数 和 布尔 恒等式 化 简 布 尔 表达 式 。 
d) 列 出 c) 部 分 求 得 的 化 简 表 达 式 的 真 值 表 。 
e) 画 出 c) 部 分 求 得 的 化 简 表 达 式 的 逻辑 图 。 

23. 仅 采 用 AND、OR 门 和 NOT 门 构建 XOR 算 符 。 

x 24. 利用 NAND 门 构建 XOR 门 。 
提示 : xXORy= (Ey) (23) 

25. 设计 一 个 电路 。 电 路 有 3 个 输入 〈z，y，z)， 用 来 表示 一 个 二 进 制 数字 的 位 数 。 电 路 还 有 3 个 输出 
(ae，5，c) 也 表示 一 个 二 进 制 数 的 位 数 。 当 输入 为 1、2 或 3 时， 二 进 制 输出 应 该 比 输入 数值 小 1。 当 
二 进 制 输入 为 4、5 或 6 时 ， 二 进 制 输出 应 该 比 输入 值 大 1。 当 输入 为 0 时， 输出 也 是 0。 而 当 输 入 等 于 
7 时 ， 输 出 也 等 于 7。 列 出 真 值 表 ， 进 行 化 简 计 算 ， 并 设计 出 最 终 电路 。 

26. 画 出 一 个 组 合 逻辑 电路 ， 直 接 对 下 面 的 布尔 表达 式 进 行 取 反 : 

F(x, y, 2) 一 Zz 十 〈Zy 十 逐 ) 
令 27. 画 出 一 个 组 合 逻 辑 电路 ， 直 接 对 下 面 的 布尔 表达 式 进行 取 反 ， 
F (z，y，z) = (zy XOR (y+z)) 十 元 z 
28. 求 出 描述 下 面 电路 的 真 值 表 : 


Xx 


Zz 


令 29. 求 出 描述 下 面 电路 的 真 值 表 : 


XxX 
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30. 


31. 
32. 
33. 


34. 


全 *35. 


36, 


全 x37. 


求 出 描述 下 面 电路 的 真 值 表 : 


针对 表 3-11 和 3-12， 分 别 画 出 能 够 实现 奇偶 发 生 器 和 奇偶 校 验 器 的 电路 。 

画 出 仅 使 用 NAND 门 组 成 的 半 加 器 。 

画 出 侈 使 用 NAND 门 组 成 的 全 加 器 。 

Tyrone Shoelaces 已 经 投入 在 股票 市 场 大 量 的 资金 。 他 从 不 轻易 相信 别人 告诉 他 的 股票 信息 。 每 当 他 准 

备 购买 某 种 股票 之 前 ， 一 定 会 从 三 个 不 同 的 途径 获取 咨询 。 第 一 个 信息 来 源 是 Pain Webster， 一 个 著名 

的 股票 交易 所 员 。 第 二 个 信息 来 源 是 Meg A， Cash， 一 个 在 股票 市 场 自 学 成 才 的 百 万 富翁 。 第 三 个 要 

咨询 的 人 是 Madame LaZora， 一 个 世界 闻名 的 具有 心灵 感应 的 大 师 。 通 过 几 个 月 来 不 断 从 这 二 种 渠道 

获得 忠告 ， 他 总 结 出 以 下 的 几 点 结论 ; 

a) 如 果 Pain 和 Meg 都 建议 购买 ， 而 只 有 心灵 感应 大 师 说 不 买 时 ， 就 买 进 股票 。 

b) 如 果 心 灵感 应 大 师 说 可 以 购买 时 ， 也 买 进 股 票 。 

c) 而 在 其 他 情况 下 ， 不 买 股票 

对 上 面 的 结论 ， 构 建 一 个 真 值 表 ， 并 求 出 对 应 的 最 小 布尔 函数 。 执 行 上 述 的 逻辑 过 程 告诉 Tyrone 先生 

何 时 可 以 购买 股票 。 

假如 有 一 个 规模 很 小 的 公司 请 你 安装 一 套 保安 系统 。 这 套 保安 系统 是 按照 身份 识别 卡 上 的 编码 的 位 数 来 定价 

的 。 通 过 识别 这 种 身份 卡 ， 持 卡 人 可 以 出 人 公司 的 某 些 特定 的 场所 。 当 然 ， 这 个 小 公司 希望 使 用 尽 可 能 少 的 

编码 位 数 来 满足 公司 所 有 的 安全 需求 。 这 样 可 以 花费 尽 可 能 少 的 经 费 。 现 在 ， 首 先 要 确定 每 张 卡 必需 的 编码 

位 数 。 然 后 对 每 个 保安 场所 的 读 卡 器 进行 编程 ， 以 确保 读 卡 器 对 身份 卡 进行 扫描 时 可 以 做 出 恰当 的 响应 。 
该 公司 的 雇员 分 为 4 类 ， 公 司 有 5 处 场所 需要 限制 某 些 员工 的 出 人 。 这 些 不 同类 型 的 人 员 和 对 他 

们 的 出 入 限制 如 下 : 

a) 大 老板 可 以 出 人 经 理 休息 室 和 经 理 卫生 间 。 

b) 大 老板 的 秘书 需要 出 入 供应 储藏 室 、 员 工 休 息 室 和 经 理 休息 室 。 

c) 计算 机 室 的 员工 需求 进入 服务 器 房间 和 员工 休息 室 。 

d) 门卫 有 权 进 入 工作 场所 的 所 有 地 点 。 

确定 各 类 人 员 在 身份 卡 上 的 编码 方式 ， 并 分 别 为 5 个 限制 场所 的 读 卡 器 构建 相应 的 逻辑 图 。 

构建 一 个 容量 为 4096 字 节 的 存储 器 需要 使 用 多 少 个 256X8 的 RAM 芯片 ? 

a) 每 个 存储 器 需要 有 多 少 位 地 址 ? 

b) 每 个 存储 器 芯片 需要 连接 多 少 根 地 址 线 ? 

c) 存储 器 的 片 选 输入 需要 多 少 根 译 码 线 ? 说 明 所 需 译 码 器 的 大 小 规格 。 

研究 分 析 下 面 电 路 的 工作 过 程 。 假 定 电路 的 初始 状态 为 0000。 按 照 时 钟 序列 描绘 电路 的 输出 

状态 (Qs)， 并 确定 该 电路 的 用 途 性 质 。 答 案 要 求 描绘 输出 变化 波形 。 





布尔 代数 和 数字 遇 耕 85 





3 


Oo 


. 描述 下 列 电路 的 工作 原理 ， 并 指出 它们 典型 的 输入 和 输出 。 同 时 ， 对 每 种 电路 画 出 仔细 标注 好 的 黑 盒 
子 示意 图 。 
a) 译 码 器 b) 多 路 复 用 器 

争 39. 完成 下 列 时 序 逻 辑 电路 的 真 值 表 : 















































42. 一 个 时 序 逻 辑 电路 包含 一 个 触发 器 ， 两 个 输入 端 : X 和 站 ， 以 及 一 个 输出 端 : S，S 取决 于 下 一 状 
态 。 具 体 电路 由 一 个 全 加 器 连接 到 一 个 JK 触发 器 构成 ， 如 下 图 所 示 。 完 成 该 时 序 逻 辑 电 路 的 特征 
表 的 最 右边 两 列 的 填充 : Next State (下 一 状态 ) 和 Output (输出 ) 栏 。 
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x 43. 一 个 Mux-Not 触发 器 (MN flip-flop) 的 工作 特性 如 下 : 如 果 M 一 1， 触 发 器 对 当前 的 状态 取 反 。 如 果 
M=0， 则 触发 器 的 下 一 个 状态 等 于 N 的 值 。 
a) 求 出 该 触发 器 的 特征 表 。 
b) 如 何 通 过 增加 门 电路 和 反 相 器 的 方法 ， 将 一 个 JK 触发 器 转换 成 MN 触发 器 。 
44. 列举 从 一 个 如 图 3-25 所 示 的 4X3 存储 器 电路 的 存储 器 中 读 出 一 个 存储 字 的 所 需 的 步骤 。 


sa 


本 章 主要 讨论 布尔 表达 式 以 及 它们 与 数字 电路 的 相互 关系 。 对 电路 进行 最 小 化 处 理 有 助 于 减少 实际 物 
理 实 现 中 所 使 用 的 电路 元 件 的 数目 。 使 用 较 少 元 件 的 电路 无 疑 会 运行 得 更 快 。 

化 简 布 尔 表达 式 可 以 采用 布尔 恒等式 。 但 是 ， 使 用 布尔 恒等式 来 进行 化 简 可 能 是 一 件 十 分 困难 的 事情 。 
原因 是 既 没有 一 定 的 规则 来 指导 怎样 应 用 这 些 恒等式 ， 也 没有 明确 的 化 简 步 又 可 循 。 布 尔 表 达 式 的 最 小 化 
处 理 ， 在 某 些 方面 就 好 像 是 做 一 道 数 学 证 明 题 。 有 时 ， 即 使 方法 正确 ， 但 是 要 完成 化 简 任务 还 是 一 件 十 分 
耗 时 和 麻烦 的 工作 。 在 本 附录 中 ， 将 介绍 一 种 化 简 布尔 表达 式 的 系统 方法 。 


3A.2 卡 诺 图 的 描述 和 基本 术语 


卡 诺 图 (Karnaugh Maps， 或 简写 为 Kmaps) 是 表示 布尔 函数 的 一 种 图 示 法 。 卡 诺 图 是 对 于 给 定 
的 布尔 表达 式 ， 将 可 能 的 各 种 输入 值 及 其 对 应 的 布尔 估 值 进行 简单 的 列表 。 表 格 的 行 和 列 是 各 种 可 能 
的 函数 输入 组 合 ， 而 中 间 的 单元 表示 对 应 于 各 种 输入 的 函数 输出 值 。 

如 果 一 个 乘积 项 中 只 包括 所 有 的 变量 一 次 ， 可 以 是 变量 的 反 码 值 ， 也 可 以 是 变量 值 的 本 身 ， 那 么 
这 个 乘积 项 称 为 小 项 (minterm)。 例 如 ， 如 果 一 个 函数 有 两 个 输入 值 ，z 和 >y， 就 可 以 有 4 个 小 项 ， 
zy、Zy、zxy、 和 zy， 来 表示 相对 于 函数 的 所 有 可 能 的 输入 组 合 。 如 果 是 3 个 输入 ，z、> 和 xz， 也 就 
有 8 个 小 项 : TJZ、Zyz、TyZ、Tyz、XyZ、Xyz、XyzZ 和 yz。 

作为 一 个 例子 ， 考 虑 布尔 函数 下 (z+，y) 一 zy 十 zy， 工 和 >》 的 所 有 可 能 的 输入 值 如 图 3A-1 所 示 。 

小 项 zy 代表 输入 对 〈0，0) 。 类 似 地 ， 小 项 zy 表示 (0，1)， 小 项 xy 表示 〈1，0)， 而 小 项 zy 表 
未 (1s 1)s 

三 变量 的 小 项 和 它们 代表 的 输入 值 ， 如 图 3A-2 所 示 。 














图 3A-1 二 变量 的 小 项 


卡 诺 图 是 一 个 列表 ， 每 个 小 项 在 表格 中 占 一 个 单元 。 也 就 是 对 于 函数 的 真 值 表 的 每 一 行 ， 卡 诺 图 都 有 
对 应 的 二 个 单元 ， 或 称 为 卡 诺 图 的 元 素 。 考 虑 函数 F(z,y) 一 zy 和 真 值 表 ， 参 见 例 3A-1。 
例 3A-1 F(zx,y)=xy 


Xx 
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对 应 的 卡 诺 图 为 : 





注意 ， 当 x 二 1 和 y==] 时 ， 卡 诺 图 中 只 有 一 个 元 素 的 数值 为 1， 对 应 的 就 是 zy 二 1。 下 面 来 看 另外 一 个 
例子 ，F(x,y) 二 Xx 十 y。 
例 3A-2 F(x,y) 一 工 十 了 








例 3A-2 中 有 3 个 小 项 具有 数值 1， 正 好 对 应 于 函数 输出 值 为 1 的 各 种 输入 组 合 。 要 确定 卡 诺 图 中 取 值 
为 1 的 单元 ， 只 需 找 到 与 真 值 表 中 取 1 所 对 应 位 置 ， 将 其 设置 为 1 即 可 。 很 明显 ， 我 们 可 以 把 函数 
F(X,y) 二 x 十 y 表示 为 所 有 取 值 为 1 的 小 项 的 “或 ”逻辑 的 形式 。 因 此 ， 范 数 F(X,y) 可 以 用 表达 式 工 y 
十 x5 十 xy 来 表示 。 显 然 ， 这 个 表达 式 并 不 是 最 简化 的 形式 (因为 这 个 函数 本 身 就 是 + 十 y)。 现 在 利用 
布尔 恒等式 进行 化 简 : 
下 (zyy) 一 元 7 十 二 十 并 y 
一 TXy 十 ZXy 十 X35 十 Xxy (请 记 住 : zy 十 zy = zy) 
一 y(T 十 ZX) 十 Xx(5 十 y) 
一 y 十 工 
一 袜 十 y 
怎样 才能 知道 需要 添加 额外 的 zy 项 呢 ? 利用 布尔 恒等式 进行 代数 化 简 是 一 件 需 要 较 高 技巧 的 工 
作 。 当 然 ， 这 也 就 是 卡 诺 图 的 有 用 之 处 。 


3A.3 利用 卡 诺 图 化 简 二 变量 函数 


在 上 面 的 函数 F(z，y) 的 化 简 过 程 中 ， 对 表达 式 的 各 个 项 进行 了 分 类 组 合 ， 这 样 可 以 提取 变量 的 
公 因 子 。 化 简 过 程 中 ， 增 加 了 一 项 xy 和 zy 进行 组 合 。 提 出 公 因子 >， 剩 下 二 Hz= 、y 
1。 但是， 如 果 使 用 卡 诺 图 进行 化 简 ， 就 不 需要 考虑 增加 什么 项 或 者 是 采用 哪 一 个 “、\ 0 
布尔 恒等式 。 因 为 这 些 都 可 以 由 卡 诺 图 来 完成 。 :二 

下 面 再 来 看 函数 (x,y) 二 x 十 y 的 卡 诺 图 ， 如 图 3A-3 所 示 。 

利用 卡 诺 图 化 简 布 尔 函 数 ， 只 需 简 单 地 把 取 值 为 1 的 小 项 进行 分 类 合并 ， 本 书 ”图 3A-3 函数 
简称 为 1 项 。 这 种 分 类 合并 的 方法 与 采用 布尔 恒等式 化 简 非 常 类 似 , 但 是 必须 遵守 Fr'>) 一 zx 十 ? 
特定 的 法 则 。 第 一 ， 只 对 到 值 为 1 的 小 项 进行 分 组 合并 ; 第 二 ， 只 对 卡 诺 图 中 位 于 的 卡 诺 图 
同一 行 或 者 是 同一 列 的 1 项 进行 分 组 合并 ， 而 不 考虑 位 于 对 角 线 上 的 1 项 。 即 需要 合并 的 是 相 邻 单元 
的 1 项 。 第 三 ， 分 组 合并 的 项 数 必须 是 2 的 指数 雷 。 第 四 ， 分 组 中 应 该 包含 尽 可 能 多 的 合并 项 。 第 五 ， 
要 合并 的 所 有 的 1 项 必须 处 在 一 个 分 组 中 即使 菜 些 分 组 只 有 一 个 1 项 )。 下 面 可 以 检验 图 3A-4 到 图 
3A-7 中 的 一 些 正确 和 错误 的 分 组 合并 。 
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a) 鲁 误 开 确 
图 3A-4 只 能 对 取 值 为 1 的 小 项 进行 分 组 合并 图 3A-5 不 能 对 位 于 对 角 线 的 小 项 进行 分 组 合并 





a) 错误 b) 下 全 


a) 错误 


图 3A-6 合并 的 项 数 必须 是 2 的 指数 罕 图 3A-7 分 组 合并 的 项 数 应 该 尽 可 能 多 


注意 ， 图 3A-6b 和 图 3A-7b 中 的 3 个 1 项 分 别 属于 两 个 不 同 的 分 组 。 这 种 分 组 方法 实际 上 等 效 于 
在 布尔 函数 中 增加 一 个 xy 项 ， 类 似 于 利用 恒等式 进行 化 简 。 卡 诺 图 中 的 zy 项 将 在 化 简 过 程 中 使 用 

要 利用 卡 诺 图 进行 化 简 ， 首 先 要 按照 上 述 规则 进行 分 组 合并 。 完 成 全 部 分 组 后 ， 仔 细 检 查 各 个 分 
组 的 小 项 ， 然 后 去 掉 每 个 分 组 中 有 变化 的 变量 。 例 如 ， 图 3A-7b 给 出 了 函数 下 (zx, y) = 工 十 y 的 正 
确 分 组 。 开 始 考虑 分 组 中 的 第 二 行 (z= 1)， 其 中 的 两 个 小 项 分 别 是 xy 和 xy。 这 个 分 组 表示 这 两 项 
的 逻辑 或 ， 即 zy 十 zy。 这 两 项 中 有 变化 的 变量 是 ?>， 所 以 丢弃 变量 y， 只 剩 下 变量 xz。 显然 ， 利 用 布 
尔 恒等式 ， 可 以 得 出 相同 的 化 简 结 果 。 而 采用 卡 诺 图 可 以 直接 去 掉 不 需要 的 变量 。 第 二 个 分 组 合并 的 
结果 为 zy 十 xy， 去 掉 有 变化 的 变量 zx， 剩 下 变量 >。 对 第 一 组 和 第 二 组 合并 的 结果 取 或 逻辑 ， 艺 为 
xz 十 y, 这 就 是 原始 函数 下 的 正确 的 化 简 形式 。 


3A. 4 利用 卡 诺 图 化 简 三 变量 函数 


卡 诺 图 方法 可 以 应 用 于 多 于 两 个 变量 的 函数 的 情形 。 在 本 专题 中 ， 将 介绍 兰 变量 函数 和 四 变量 函 
数 的 卡 诺 图 。 这 种 方法 可 以 扩充 到 五 变量 或 更 多 变量 的 情形 。 读 者 
可 以 在 本 章 的 深入 阅读 部 分 所 推荐 的 Maxfield (1995) 的 著作 中 ， 
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获得 有 关卡 诺 图 更 详细 的 知识 。 | Tg Tv 
了 解 了 怎样 生成 二 变量 函数 的 卡 诺 图 ， 可 以 很 方便 地 推广 到 三 7 [vz [vz | 2 | 

变量 的 函数 ， 如 图 3A-8 所 示 。 图 3A-8 三 变量 函数 的 小 项 
三 变量 卡 诺 图 形式 的 第 一 个 区 别 是 ， 表 中 的 两 个 变量 y 和 >z， 和 卡 诺 图 形式 


是 组 合 在 一 起 的 。 第 二 个 区 别 是 对 列 的 编号 并 不 是 按照 顺序 进行 的 。 图 中 列 的 标号 顺序 为 00，01， 
11，10， 而 不 是 正常 的 三 进 制 数 的 大 小 排列 次 序 ，00，01，10，11。 卡 诺 图 的 输入 值 必须 按照 这 种 方 
法 进行 排序 ， 这 样 才 能 保证 任意 相 邻 的 每 个 小 项 中 只 有 一 个 变量 互 反 。 按 照 这 种 排列 顺序 ， 例 如 01 后 
面 为 11， 对 应 的 小 项 就 是 zyz 和 zyz， 只 有 变量 y 互 反 。 利 用 卡 诺 图 化 简 需 要 去 掉 发 生变 化 的 变量 ， 
所 以 必须 保证 两 个 小 项 的 组 合 中 只 有 一 个 变量 互 反 。 

在 前 面 的 二 变量 函数 的 例子 中 所 取 的 最 大 组 合 是 两 个 取 值 为 1 的 小 项 。 当 然 ， 也 可 以 有 4 个 取 值 
为 1 的 小 项 组 合 ， 甚 至 可 能 大 到 8 个 1 项 的 组 合 ， 这 完全 取决 于 函数 本 身 。 下 面 是 几 个 利用 卡 诺 图 化 
简 三 变量 函数 的 例子 。 

例 3A-3 下 (zyyyz) 一 元 7z 十 元 y& 十 工 7Z 十 工 yZ 





同样 ， 要 根据 上 面 的 分 组 原则 来 进行 分 组 合并 。 很 明显 ， 可 以 有 几 种 方法 按 两 个 小 项 为 一 组 来 进行 分 
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组 。 但 是 ， 分 组 规则 要 求生 成 最 大 的 分 组 ， 而 且 分 组 的 大 小 必须 是 2 的 指数 咽 。 因 此 ， 在 本 例 中 只 能 
有 一 个 4 个 1 项 组 成 的 合并 分 组 。 分 组 方法 如 下 : 






! | 1 | 1 玫 
完全 没有 必要 再 产生 额外 的 两 项 组 成 的 分 组 .分 组 越 少 ， 化 简 后 函数 的 项 数 也 越 少 。 需 要 牢记 的 
是 ， 要 化 简 表 达 式 ,必须 保证 所 有 的 1 项 都 处 在 各 个 分 组 之 中 。 
如 果 有 一 个 4 个 1 项 的 分 组 ， 如 何 进行 化 简 呢 ?在 分 组 中 的 两 个 数值 为 1 的 小 项 可 以 去 掉 一 个 变 
量 , 分 组 中 4 个 数值 为 1 的 小 项 则 可 以 去 掉 两 个 变量 : 即 全 部 4 项 中 都 不 同 的 两 个 变量 。 对 于 上 例 中 
的 4 单元 分 组 ， 有 4 个 小 项 : 本 z=、Xyz、x53z 和 xyz。 这 里 ， 只 有 变量 > 是 相同 不 变 的 ， 而 变量 zx 和 y 
是 不 同 的 。 所 以 要 去 掉 变 量 x 和 yy， 最 后 化 简 得 到 的 函数 为 ,: F(z，y) = zx。 下 面 青 利用 布尔 恒等式 ， 
来 证 明 本 例 的 化 简 结果 的 正确 性 。 注意 ， 这 个 函数 最 初 就 是 表示 为 取 值 为 1 的 小 项 的 逻辑 “或 ”的 
形式 。 
F(x, yz) 一 元 z 十 元 yz 十 工 Z 十 工 yz 
一 元 《7ZzZ 十 yzZ) +r (yz yz) 
二 (Tz 十 Xx) (yz 二 yz) 
= Tz yz 
= (J 二 +y) z 
可 见 ， 利 用 布尔 恒等式 得 到 的 结果 和 卡 诺 图 化 简 的 结果 完全 一 致 。 
有 时 ， 分 组 的 过 程 需要 一 些 技巧 。 下 面 的 例子 就 需要 对 卡 诺 图 进行 仔细 的 审查 。 
例 3A-4 F(x,y,z) 二 yz 十 ZYyz 十 yz 十 yz 十 XDZ 十 YZ 





这 个 问题 需要 一 点 技巧 有 两 个 理由 有些 分 组 相互 重合 ， 并 且 有 一 个 分 组 是 环绕 连接 在 一 起 的 《wraps 
around) 。 也 就 是 第 一 列 最 左边 的 1 与 最 后 一 列 最 右边 的 1 可 以 组 合 为 一 组 ， 央 为 第 一 列 和 最 后 一 列 在 
逻辑 上 是 相 邻 的 〈 可 以 想像 是 将 卡 诺 图 画 在 一 个 图 柱 面 上 ) 。 同 样 ， 卡 诺 图 的 第 一 行 和 最 后 一 行 在 逻辑 
上 也 是 相 邻 的 ， 这 一 点 在 后 面 4 变量 卡 诺 图 中 会 变 得 非常 明显 。 

正确 的 合并 分 组 为 : 





其 中 第 一 个 分 组 化 简 的 结果 为 未 (4 个 变量 中 只 有 一 个 是 相同 的 ) ， 第 二 个 分 组 化 简 的 结果 为 二。 因此， 
最 终 化 简 的 结果 为 F(x,y,z) 二 十 Zz。 | | 
例 3A-5 下 面 考虑 所 有 单元 都 是 1 项 的 卡 诺 图 。 如 下 面 的 卡 诺 图 : 
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图 中 关于 1 项 的 最 大 分 组 为 一 个 包含 8 个 小 项 的 组 ， 即 所 有 的 1 都 分 在 同一 组 内 。 这 样 的 问题 如 何 进 
行 化 简 呢 ? 我 们 仍然 可 以 遵守 前 面 所 用 的 相同 法 则 。 切 记 : 包含 2 个 小 项 的 分 组 可 以 去 掉 一 个 变量 ， 
包含 4 个 小 项 的 分 组 可 以 去 掉 2 个 变量 ， 而 包含 8 个 元 素 的 分 组 可 以 去 掉 3 个 变量 。 其 结果 是 去 掉 了 
所 有 的 变量 ， 最 后 得 到 的 简化 函数 : FCz,y,z) 王 1。 如 果 仔细 检查 这 个 函数 的 真 值 表 ， 不 难 发 现 函 数 
化 简 的 结果 的 确 是 正确 的 。 局 


3A.5 利用 卡 诺 图 化 简 四 变量 函数 


现在 可 以 把 卡 诺 图 化 简 技 巧 推广 到 四 变量 函数 的 情形 。4 个 变量 可 以 产生 16 个 小 项 ， 如 图 3A-9 
所 示 。 但 是 注意 ; 对 于 卡 诺 图 中 的 行 和 列 都 必须 采用 11 后 跟随 10 的 特殊 顺序 排列 。 





















WX 00 ol 1 10 
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图 3A-9 四 变量 的 小 项 和 卡 诺 图 的 形式 
例 3A-6 为 一 个 四 变量 肾 数 的 表示 方法 和 化 简 过 程 。 这 里 只 画 出 元 素 为 1 的 项 ， 而 略 去 0 不 写 。 
例 3A-6 
Fl(w, ry,z)—=WIIZTDIYIZT WIYyZT HryT WIE wy wey 











其 中 ,分 组 1 是 一 个 如 前 面 所 示 的 “环绕 (wrap-around)” 分 组 。 分 组 3 是 显而易见 的 组 合 。 而 分 组 2 
是 一 个 极端 环绕 分 组 的 情形 ， 即 它 包 括 了 卡 诺 图 4 个 角 上 的 元 素 1。 切 记 : 卡 诺 图 的 4 个 角 在 逻辑 上 也 
是 相 邻 的 。 最 后 ， 函 数 下 被 化 简 成 3 项 ， 每 个 分 组 都 只 留 下 一 项 : Ty (分 组 1)，zz (分 组 2)， 和 
而 yz (分 组 3) 。 所 以 ， 最 后 得 到 的 化 简 结果 为 ， FCw,z,y,z) 二 Zy 十 zZ 十 丁 yz。 国 
有 时 ， 在 利用 卡 诺 图 进行 化 简 时 ， 可 以 有 不 同 合并 分 组 的 选择 。 参 见 例 3A-7。 
例 3A-7 卡 诺 图 分 组 的 不 同 选择 
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组 却 有 不 同 的 选择 。 它 可 以 与 殉 zyz 的 项 分 为 一 组 ， 也 可 以 与 殉 z 下 的 项 分 为 一 组 (一 个 环绕 分 组 )。 
因此 ， 有 下 面 的 两 个 分 组 方案 : 





其 中 ， 第 一 个 分 组 方式 得 到 的 卡 诺 图 化 简 结 果 为 : F(w,x,y,z) 王 Fl 二 至 十 本 yz 十 硬 rzry。 第 二 个 分 组 方 

式 的 卡 诺 图 化 简 结果 为 : F(zwyzry,z) 王 FF2 一 死 十 画 yz 十 吉 zz。 这 两 个 化 简 结 果 Fl 和 Fz 的 最 后 一 项 不 

同 。 但 是 ， 它 们 在 逻辑 上 是 等 价 的 。 这 个 问题 的 证 明 将 留 给 读者 ， 只 需要 生成 这 两 个 函数 的 真 值 表 就 

可 以 检验 局 和 Fa 的 等 效 性 。 这 两 个 化 简 的 结果 有 相同 的 项 数 和 变量 数目 。 根 据 化 简 的 法 则 ， 卡 诺 图 

最 小 化 处 理 可 以 产生 最 小 化 的 函数 〈 因 而 对 应 于 一 个 最 小 的 电路 )， 但 是 这 些 最 小 化 的 函数 的 表示 并 不 

一 定 是 唯一 的 。 国 
在 介绍 后 面 的 内 容 之 前 ， 先 对 卡 诺 图 化 简 方 法 的 法 则 总 结 如 下 : 

. 只 对 包含 1 的 单元 进行 分 组 合并 ， 不 必 考 虑 包含 0 的 单元 。 

.只 有 相 邻 的 单元 才能 合并 成 一 组 ， 位 于 对 角 线 上 的 单元 不 能 进行 合并 。 

. 一 个 分 组 内 包含 1 的 单元 的 数目 应 该 是 2 的 指数 寡 。 

. 在 满足 化 简 法 则 的 条 件 下 ， 合 并 的 分 组 应 该 尽 可 能 大 。 

. 全 1 元 素 的 卡 诺 图 的 分 组 必须 属于 同一 个 分 组 ， 即 使 分 组 是 单一 的 1 项 分 组 。 

.分 组 时 允许 相互 重 亚 。 

. 分 组 的 元 素 可 以 环绕 。 

8. 尽 可 能 地 使 用 较 少 数目 的 分 组 。 

使 用 上 述 法 则 ， 再 讨论 另外 一 个 四 变量 函数 的 例子 。 例 3A-8 列举 了 上 述 法 则 的 几 种 应 用 例子 。 

例 3A-8 

F(w, ry 2)— WIIE+UIYL UII Tryz 





~ 四则 





二 wryzTwryz wiyzt wiyz 





在 本 例 中 ， 有 一 个 合并 分 组 中 只 有 一 个 单一 元 素 。 根 据 上 面 的 法 则 ， 我 们 不 可 能 将 其 他 的 元 素 与 这 
一 项 合并 。 最 后 ， 上 面 卡 诺 图 中 所 表示 的 函数 化 简 为 : F(w,z,y,z) 二 yz 十 rz 十 WZyZ 十 twEy。 图 

如 果 已 知 的 函数 不 是 表示 为 小 项 和 的 形式 ， 我 们 仍然 可 以 使 用 卡 诺 图 对 函数 进行 化 简 。 但 是 在 进 
行 这 类 函数 的 化 简 之 前 ， 需 要 采用 生成 卡 诺 图 的 逆向 过 程 来 进行 操作 。 例 3A-9 阐述 了 这 种 道 向 操作 

例 3A-9 一 个 非 小 项 和 表示 形式 的 函数 

假设 已 知 函 数 F(x ,zr,y,z) 二 而 ry 十 而 Tyz 十 而 zyz。 由 于 函数 的 最 后 两 项 是 小 项 ， 我 们 很 容易 在 卡 
诺 图 中 对 应 位 置 找到 1 项 的 单元 。 但 是 ， 函 数 的 第 一 项 本 ty 为 非 小 项 。 如 果 假 定 这 一 项 是 对 一 个 卡 庄 
图 进行 分 组 合并 的 结果 ,那么 被 去 掉 的 变量 就 是 z 项 。 因此， 这 一 项 实际 上 等 效 于 下 面 两 项 的 和 : 
可 Tyz 十 而 +yz。 这 样 就 可 以 在 卡 诺 图 中 使 用 这 两 项 来 替代 原来 函数 中 的 第 一 项 ， 因 为 它们 都 是 小 项 。 
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因此 ， 得 到 了 以 下 卡 诺 图 : 








最 后 ， 函 数 Fl(w,x,y,z) 二 而 Ty 十 本 Tyz 十 WTyz 化 简 为 : F(tw,x,y,z) 一 证 y。 [| 
3A.6 无 关 条 件 


在 某 些 情况 下 ， 不 能 完全 指定 一 个 函数 。 也 就 是 说 存在 着 某 些 输入 ， 对 于 函数 来 说 是 没有 被 定义 ， 
或 者 是 不 明确 的 。 例 如 ， 考 虑 一 个 4 输入 的 函数 ， 用 作为 从 0 到 10 进行 计数 的 二 进 制 的 数位 。 这 里 采 
用 位 的 组 合 : 0000，0001，0010，0011，0100，0101，0110，0111，1000，1001，1010。 但 是 ， 还 有 
下 面 的 一 些 输入 组 合 : 1011，1100，1101，1110，1111， 没 有 被 计数 器 所 使 用 。 因 此 ， 后 面 的 输入 组 
合 是 非法 的 。 这 就 是 说 ， 如 果 从 真 值 表 来 看 ， 这 些 数值 既 不 能 是 0， 也 不 能 是 1。 它 们 根本 不 应 该 在 真 
值 表 中 出 现 。 

利用 这 些 无 关 的 〈 无 影响 的 ，don”t care) 输入 可 以 帮助 卡 诺 图 化 简 过 程 。 因 为 这 些 输入 值 可 以 
根据 需要 把 它们 设置 为 0 或 1， 取 决 于 是 否 最 有 帮助 。 基 本 的 思想 是 以 下 面 的 方式 设置 这 些 “ 无 关 ” 的 
值 : 它们 或 者 可 以 构成 一 个 较 大 的 合并 分 组 ,或 者 根本 就 不 在 分 组 中 。 例 3A-10 阐明 的 就 是 这 样 的 
概念 。 

例 3A-10 ”无 关 条 件 

通常 ， 这 些 无 关 的 值 在 对 应 的 单元 中 用 “X” 来 表示 。 下 面 的 卡 诺 图 将 说 明 怎样 使 用 这 些 值 来 帮 
助 进行 最 小 化 处 理 。 在 第 一 行 中 我 们 将 这 些 无 关 值 当 作 1 元 素 ， 从 而 可 以 构成 一 个 4 元 素 的 合并 分 组 。 
而 在 行 01 和 11 中 将 无 关 值 当 作 0 来 处 理 。 这 样 ， 函 数 简 化 成 : Fl (ww,z,yvz) 一 码 工 十 yz。 





还 可 以 用 另外 的 一 种 方式 来 对 这 些 值 进行 合并 分 组 : 





采用 上 面 的 分 组 方法 ， 最 后 的 化 简 结 果 为 : FF (w,zx,y,z) 二 而 zx 十 yz。 值 得 注意 的 是 ， 这 里 的 Fl 和 Fz 
不 相等 。 但 是 ， 如 果 对 两 个 函数 生成 真 值 表 ， 不 难 发 现 ， 只 有 在 输入 无 关 的 值 的 情况 下 ， 它 们 才 会 产 
生 不 相等 。 加 
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3A.7 小结 


这 部 分 内 容 简单 介绍 了 卡 诺 图 和 利用 卡 诺 图 化 简 布尔 函数 的 方法 。 一 方面 ， 直 接 使 用 布尔 等 式 进 
行 布尔 函数 的 化 简 可 能 会 很 困难 ， 并 且 很 不 方便 。 另 一 方面 ， 卡 诺 图 提供 了 一 种 寻找 布尔 函数 最 小 表 
示 的 严格 步骤 。 因 此 ， 利 用 卡 诺 图 化 简 方 法 可 以 很 方便 地 找到 布尔 函数 表示 所 对 应 的 最 小 电子 线路 。 
练习 题 
1 对 于 由 下 列 卡 诺 图 所 定义 的 布尔 函数 ， 写 出 其 化 简 后 的 表达 式 : 

a) yz 


CS 


. 对 于 下 面 的 布尔 函数 ， 生 成 其 卡 诺 图 和 进行 化 简 : 
a) F(xr,y,2)—= TyIZ+Tyz EyZ 
b) F(x, yz) = FIZTIYZTIITT Try 
cC) F(xr,y,z) = Iz Iz xyz 


.对 于 由 下 列 卡 诺 图 定义 的 布尔 函数 ， 写 出 其 化 简 后 的 表达 式 ， 


CD 


a) 








心 
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. 首先 生成 对 应 的 卡 诺 图 ， 然 后 化 简 下 列 隐 数 : 





a) F(w,x, yz)—=WTIZTWIyTTWIIZT WIyZT WHITYTH WTIYITH wrYyT 





b) Flw, ry,2)—= WIyEHDTIZH Wryzt wrys tt wry 


c) Flw, ryy 2)—= I wy Wryt Diy wiEyz 


. 对 于 下 面 的 卡 诺 图 ， 从 代数 上 “利用 布尔 恒等式 ) 证 明 这 个 包含 4 项 的 申 数 如 何 被 化 简 为 只 有 1 项 的 
函数 。 








当 我 们 使 用 仪器 工作 时 ， 自 己 千 万 不 要 将 问题 复杂 化 。 


Leonardo da Vinci 


第 4 章 MARIE: 简单 计算 机 模型 


4.1 概述 


今天 ， 计 算 机 设计 是 那些 经 过 大 量 训 练 计算 机 工程 师 的 工作 。 在 类 似 本 书 这 样 的 入 门 教材 (教授 
计算 机 组 成 与 体系 结构 的 人 门 课程 ) 中 ， 对 于 设计 和 构建 一 台 目 前 可 以 购买 到 的 工作 计算 机 的 讲解 不 
可 能 面面俱到 。 但 是 ， 本 章 将 首先 研究 一 种 非常 简单 的 计算 机 模型 ， 称 为 MARIE: 一 种 非常 直观 和 简 
单 的 计算 机 体系 结构 。 然 后 ， 再 简单 介绍 Intel 和 MIP 结构 的 计算 机 系统 ,两 种 分 别 基 于 CISC 和 
RISC 设计 思想 的 流行 体系 结构 。 本 章 的 目的 是 向 读者 介绍 计算 机 的 工作 原理 。 因 此 ， 遵 从 本 书 开 始 时 
引用 的 Leonardo da Vinci 的 建议 ， 我 们 将 尽 可 能 简单 介绍 计算 机 体系 结构 。 


4.1.1 CPU 的 基本 知识 和 组 成 原理 


从 第 2 章 ( 数 据 表示 方法 ) 的 讨论 中 我 们 了 解 到 ， 计 算 机 处 理 的 必须 是 二 进 制 编码 的 数据 。 同样 ， 
第 3 章 的 内 容 表 明 ， 存 储 器 也 是 以 二 进 制 数 的 方式 存储 数据 和 程序 指令 。 无 论 如 何 ， 计 算 机 都 必须 正 
确 地 处 理 数据 和 执行 程序 。 中 央 处 理 器 (central processing unit，CPU) 的 任务 就 是 负责 提 地 程序 指 
令 ， 并 对 指令 进行 译 码 ， 然 后 按 程序 规定 的 顺序 对 正确 的 数据 执行 各 种 操作 。 要 了 解 计算 机 的 工作 原 
理 ， 首 先 必须 熟悉 计算 机 的 组 成 部 分 ， 以 及 各 组 件 之 间 的 相互 关系 。 为 了 学 习 下 一 节 将 要 介绍 的 简单 
体系 结构 ， 我 们 首先 从 一 般 意义 上 来 讨论 在 现代 计算 机 控制 级 别 的 微观 体系 结构 。 

所 有 计算 机 都 有 中 央 处 理 器 。 中 央 处 理 器 可 以 分 成 两 部 分 。 第 一 部 分 是 数据 通道 〈datapath)， 它 
是 一 种 由 存储 单元 (寄存器) 和 算术 逻辑 单元 〈 对 数据 执行 各 种 操作 ) 所 组 成 的 网 络 。 这 些 组 件 通过 
总 线 〈 总 线 是 传递 数据 的 电子 线路 ) 连接 起 来 ， 并 利用 时 钟 来 控制 时 间 。CPU 的 第 二 部 分 是 控制 单元 
(control unit) ， 该 模块 负责 对 各 种 操作 进行 排序 并 保证 各 种 正确 的 数据 适时 地 出 现在 所 需 的 地 方 。 这 
两 部 分 组 合 在 一 起 ， 就 可 以 完成 CPU 的 各 种 工作 任务 : 提取 指令 、 指 令 译 码 和 按 规定 的 顺序 执行 各 种 
操作 。 数 据 通道 和 控制 单元 的 设计 将 直接 影响 到 计算 机 的 性 能 。 因 此 ， 接 下 来 的 内 容 将 详细 介绍 CPU 
的 这 些 组 成 部 分 。 





计算 机 系统 中 使 用 寄存 器 来 存储 各 种 数据 ， 例 如 : 地址、 程序 计数 器 或 者 是 程序 执行 所 需要 的 数 
据 。 简 单 地 说 ， 寄 存 器 (register) 是 一 种 存储 二 进 制 数据 的 硬件 设备 。 寄 存 器 位 于 处 理 器 的 内 部 ， 所 
以 处 理 器 可 以 非常 快 地 访问 寄存 器 中 存储 的 各 种 信息 。 第 3 章 中 介绍 了 利用 D 触发 器 来 构建 寄存 器 。 
D 触发 器 等 效 于 一 个 1 位 的 寄存 器 ， 所 以 存储 多 位 的 数值 需要 一 组 D 触发 器 的 集合 。 例 如 ， 要 构建 一 
个 16 位 的 寄存 器 ， 需 要 将 16 个 D 触发 器 连接 起 来 。 从 第 3 章 的 有 关 二 进 制 计数 器 的 内 容 中 我 们 了 解 
到 ， 这 些 组 成 寄存 器 的 触发 器 集合 必须 在 时 钟 的 控制 之 下 统一 同步 工作 。 随 着 每 个 时 钟 脉 冲 的 发 生 ， 
各 种 数据 可 以 输入 到 寄存 器 中 。 而 且 ， 这 些 被 输入 的 数据 在 下 一 个 时 钟 脉冲 到 来 之 前 不 会 发 生 任何 改 
变 ， 也 就 是 被 存储 在 寄存 器 中 。 

计算 机 通常 处 理 的 是 一 些 存 储 在 寄存 器 中 ， 具 有 固定 大 小 的 二 进 制 字 的 数据 。 所 以 ， 大 部 分 计算 
机 配 有 特定 大 小 的 寄存 器 。 通 用 的 寄存 器 的 大 小 有 : 16 位 、32 位 和 64 位 。 寄 存 器 的 数量 一 般 会 随 着 
结构 的 不 同 而 有 所 变化 ， 通 常 是 按照 2 的 指数 寡 进 行 配 置 ， 其 中 16 位 和 32 位 寄存 器 是 最 普 裔 的 。 寄 
存 器 可 以 存储 数据 、 地 址 或 控制 信息 。 某 些 寄存 器 会 被 赋予 “专门 的 用 途 ”， 或 者 只 能 用 于 存储 数据 ， 
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或 者 只 能 用 于 存放 地 址 ， 或 者 只 用 于 存储 各 种 控制 信息 。 而 其 他 一 些 寄存 器 则 属于 通用 类 型 ， 可 以 在 
不 同时 刻 分 别 保存 数据 、 地 址 或 控制 信息 。 

可 以 向 寄存 器 写 人 或 从 其 读 取信 息 ， 信 息 也 可 以 在 不 同 的 寄存 器 之 间 传 递 。 寄 存 器 的 编 址 方式 与 
存储 器 不 同 。 每 一 存储 器 字 都 有 一 个 唯一 的 二 进 制 地 址 ， 这 些 地 址 从 0 开始 进行 编码 。 寄 存 器 则 是 由 
CPU 内 部 的 控制 单元 进行 编 址 和 处 理 的 。 

现代 计算 机 系统 中 有 各 种 不 同类 型 的 专用 寄存 器 : 存储 信息 的 寄存 器 、 进 行 数值 移 位 的 寄存 器 、 
进行 数值 比较 的 寄存 器 和 计数 寄存 器 。 还 有 “中 间 结 果 ” 寄 存 器 用 来 存储 临时 数据 值 ， 变 址 寄存 器 用 
来 控制 程序 的 循环 操作 ， 堆 栈 指针 寄存 器 用 于 管理 所 处 理 的 信息 堆栈 ， 状 态 寄存 器 用 于 保持 各 种 工作 
状态 或 操作 模式 〈 比 如 溢出 、 进 位 或 一 些 零 条 件 等 ) 。 另 外 ， 通 用 寄存 器 是 程序 员 可 以 访问 的 寄存 器 。 
大 多 数 计算 机 都 对 寄存 器 进行 分 组 ， 不同 的 组 用 于 不 同 的 特定 目的 。 例 如 ， 在 Pentium 体系 结构 的 
CPU 中 ， 就 有 数据 寄存 器 组 和 地 址 寄存 器 组 。 某 些 体系 结构 采用 大 量 非 常 庞大 的 寄存 器 组 ， 这 些 寄存 
器 组 可 以 使 用 一 种 全 新 的 方式 来 加 速 指令 的 执行 〈 这 一 部 分 内 容 将 在 第 9 章 高 级 体系 结构 中 再 进行 讨 
论 ) 。 


ALU 

算术 逻辑 单元 〈arithmetic logic unit，ALU) 在 程序 执行 过 程 中 用 于 进行 逻辑 运算 (如 比较 运算 ) 
和 算术 运算 (如 加 法 和 乘法 运算 )。 第 3 章 已 经 给 出 了 一 个 简单 的 ALU 的 例子 。 一 般 情况 下 ，ALU 有 
两 个 数据 输入 和 一 个 数据 输出 。ALU 中 的 各 种 操作 常常 会 影响 状态 寄存 器 (status register) 的 某 些 数 
据 位 的 数值 〈 设 置 这些 数 据 位 是 为 了 指示 某 些 动作 ， 例 如 是 否 有 滋 出 发 生 )。 通 过 控制 单元 发 出 的 信 
号 ， 控 制 ALU 执行 各 种 规定 的 运算 。 


控制 单元 (control unit) 是 CPU 中 的 “警察 ”或 “交通 管理 员 ”。 控 制 单元 负责 监视 所 有 指令 的 
执行 和 各 种 信息 的 传送 过 程 。 控 制 单元 负责 从 内 存 提 取 指 令 ， 对 这 些 指令 进行 译 码 ， 确 保 数 据 适 时 地 
出 现在 正确 的 地 方 。 控 制 单元 还 负责 通知 ALU 应 该 使 用 哪 一 个 寄存 器 ， 执 行 哪些 中 断 服务 程序 ， 以 
及 对 所 需 执行 的 各 种 操作 接 通 ALU 中 的 正确 电路 。 控 制 单元 使 用 一 个 称 为 程序 计数 器 (program 
counter) 的 寄存 器 来 寻找 下 一 条 要 执行 的 指令 的 位 置 ， 并 使 用 一 个 状态 寄存 器 来 存放 某 些 特殊 的 操作 
状态 ， 比 如 溢出 、 进 位 、 借 位 和 类 似 的 状态 等 。4. 7 节 将 更 详细 地 讨论 控制 单元 。 


4. 1.2 总 线 


CPU 通过 总 线 与 其 他 的 部 件 连 接 起 来 。 总 线 (bus) 是 一 组 导电 线路 的 组 合 ， 它 作为 一 个 共享 和 
公用 的 数据 通道 将 系统 内 的 各 个 子 系统 连接 在 一 起 。 总 线 由 多 条 线路 构成 ， 这 样 总 线 允 许 许多 位 数据 
并 行 传递 。 总 线 的 制造 成 本 低廉 ， 用 途 广 泛 。 利 用 总 线 可 以 很 方便 地 进行 新 设备 之 间 的 互 连 ， 以 及 新 
设备 与 系统 之 间 的 连接 。 在 任意 时 刻 ， 只 能 有 一 个 设备 〈 可 能 是 寄存 器 、ALU、 内 存 或 者 是 其 他 某 个 
设备 ) 使 用 总 线 。 但 是 ， 这 种 共享 总 线 的 方式 可 能 会 引起 通信 上 的 瓶颈 。 总 线 的 速度 通常 受 总 线 长 度 
和 共享 总 线 的 设备 数目 的 影响 。 在 更 通常 的 情况 下 ， 各 种 设备 分 为 主 〈master) 设备 和 从 (slave) 设 
备 两 种 类 型 。 主 设备 是 最 初 启动 的 设备 ， 而 从 设备 是 响应 主 设备 请 求 的 设备 。 

总 线 可 以 实现 以 点 对 点 〈pointrto-point) 的 方式 连接 两 个 特定 的 设备 〈 如 图 4-1a 所 示 )， 或 者 将 总 
线 用 作 一 条 公用 通道 (coinmon pathway) 来 连接 多 个 设备 。 要 求 多 个 设备 共享 的 总 线 称 为 多 点 (mul- 
tipoint) 总 线 ， 如 图 4-lb 所 示 。 

由 于 需要 共享 总 线 ， 所 以 总 线 协议 〈bus protocol， 使 用 规则 集 ) 非常 重要 。 典 型 的 计算 机 总 线 包 
括 数据 总 线 、 地 址 总 线 、 控 制 总 线 和 电源 线 ， 如 图 4-2 所 示 。 用 于 数据 传递 的 总 线 称 为 数据 总 线 (data 
bus)， 数 据 总 线 传递 的 是 必须 在 计算 机 的 不 同位 置 之 间 移动 的 实际 信息 。 计 算 机 通过 控制 总 线 (con- 
trol line) 指示 哪个 设备 允许 使 用 总 线 ， 以 及 使 用 总 线 的 目的 〈 例 如 ， 是 读 还 是 写 内 存 或 IO 设备 )。 
控制 总 线 也 传递 有 关 总 线 请 求 、 中 断 和 时 钟 同步 信号 的 响应 信号 。 地 址 总 线 (address line) 指出 数据 
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b) 多 点 总 线 
图 4-1 典型 的 计算 机 总 线 


读 写 (如 内 存 中 ) 的 位 置 。 电 源 线 (power line) 为 计算 机 提供 所 需 的 电力 。 典 型 的 总 线 事件 包括 传送 
读 写 地 址 信息 ， 从 内 存 传递 数据 到 寄存 器 〈 称 为 内 存 读 )， 以 及 从 寄存 器 传递 数据 到 内 存 (内 存 写 )。 
另外 ， 总 线 还 用 于 从 外 围 设备 进行 LO 设备 的 读 写 。 各 种 信息 的 传递 都 发 生 在 一 个 总 线 周期 (bus cy- 
cle) 内 。 总线 周期 是 完成 总 线 信息 传送 所 需 的 时 钟 脉冲 间 的 时 间 间 隔 。 

由 于 总 线 传递 的 信息 类 型 不 同 ， 使 用 总 线 的 设备 不 同 ， 所 以 总 线 还 可 以 细 分 成 各 种 不 同 的 种 类 。 
处 理 器 -内 存 总 线 (processor-memory bus) 是 长 度 较 短 的 高 速 总 线 ， 这 种 总 线 将 处 理 器 和 与 机 器 匹配 
的 内 存 系统 最 紧密 地 连接 在 一 起 ， 并 最 大 限度 地 扩充 这 种 总 线 的 带宽 〈 数 据 传 递 的 带宽 )。 处 理 器 -内 
存 总 线 需 要 进行 专门 的 设计 。I/O 总线 (IO bus) 通常 比 处 理 器 -内 存 总 线 长 ， 可 以 连接 不 同 带 宽 的 各 
种 设备 。 这 类 总 线 可 以 兼容 多 种 不 同 的 体系 结构 。 底 板 总 线 (backplane bus， 或 称 为 主板 总 线 ) 实际 
上 是 构建 在 机 器 主板 上 的 一 条 总 线 ， 如 图 4-3 所 示 。 利 用 这 条 主板 总 线 可 以 将 主板 上 的 所 有 部 件 如 处 
理 器 、LI/O 设备 和 内 存 连接 在 一 起 ， 也 就 是 所 有 的 设备 共享 一 条 总 线 。 许 多 计算 机 还 采用 总 线 分 层 结 
构 ， 在 同一 系统 中 有 两 条 (例如 一 条 处 理 器 -内 存 总 线 和 一 条 1/O 总 线 ) 或 多 条 总 线 是 很 常见 的 。 高 性 
能 的 系统 常常 包含 上 述 全 部 三 类 总 线 。 

关于 总 线 ， 个 人 计算 机 有 自己 专门 的 总 线 术 语 。PC 机 使 用 一 条 内 总 线 ( 称 为 系统 总 线 ，system 
bus) 连接 CPU、 内 存 和 所 有 其 他 内 部 部 件 。 而 采用 外 总 线 (有 时 称 为 扩展 总 线 ，expansion bus) 来 
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图 4-2 计算 机 的 总 线 组 成 





4-3 某 种 底板 总 线 


连接 各 种 外 围 设备 ， 扩 展 插 权 和 I//O 端口 到 计算 机 的 其 他 部 分 。 大 多 数 个 人 计算 机 还 有 局 部 总 线 
(local bus)， 可 以 将 外 设 直接 连接 到 CPU 的 数据 总 线 上 。 这 些 总 线 的 速度 很 快 ， 但 只 能 连接 数量 有 
限 、 性 质 相 近 的 设备 。 扩 展 总 线 的 速度 则 要 慢 一 些 ， 但 可 以 连接 更 广泛 的 设备 。 第 7 章 会 详细 讨论 
这 部 分 内 容 。 

从 物理 结构 上 来 说 ,总线 只 是 一 些 导 线 的 集合 。 但 是 ， 这 些 导线 对 于 各 种 连接 器 、 定 时 方式 和 信 
号 特性 有 特定 的 标准 ， 并 且 有 严格 的 协议 。 同 步 (synchronous) 总 线 是 由 时 钟 控制 的 ， 各 种 事件 只 有 
在 时 钟 脉冲 到 来 时 才 会 发 生 ， 也 就 是 事件 发 生 的 顺序 由 时 钟 脉冲 来 控制 。 每 个 设备 都 由 时 钟 走动 的 速 
率 ， 称 为 时 钟 频率 (clock rate) ， 来 进行 同步 。 前 面 提 到 的 总 线 周 期 正好 与 总 线 的 时 钟 频率 成 反比 。 例 
如 ， 如 果 总 线 的 时 钟 频率 为 133MHz， 那 么 总 线 周 期 的 时 间 长 度 就 是 1/133 000 000 秒 ,， 或 7.52ns。 因 
为 需要 时 钟 来 控制 各 种 事件 的 发 生 ， 所 以 任何 时 钟 脉冲 产生 的 相位 误差 (clock skew) (或 称 为 时 钟 脉 
冲 的 漂移 ) 都 可 能 带 来 一 些 严重 的 问题 。 这 就 意味 着 总 线 必须 尽 可 能 地 保持 短 ， 这 样 时 钟 脉冲 的 发 生 
漂移 就 不 会 变 得 太 大 。 另 外 ， 总 线 周 期 时 间 不 能 短 于 信息 在 总 线 上 传送 所 需要 的 时 间 。 因 此 ， 总 线 的 
长 度 对 总 线 的 时 钟 频率 和 周期 时 间 会 有 一 定 的 限制 。 

各 种 控制 线 都 是 使 用 异步 〈asynchronous) 总 线 来 负责 协调 计算 机 的 各 种 操作 。 这 种 异步 总 线 必 
须 采 用 一 种 较为 复杂 的 担 手 协议 (handshaking protocol) 来 强制 实现 与 计算 机 其 他 操作 的 同步 。 例 如 ， 
要 从 内 存 中 读 取 一 个 数据 字 ， 协 议 就 会 要 求 有 类 似 于 如 下 的 步骤 : 

1. ReqREAD: 激活 此 总 线 控制 线 并 同时 将 数据 内 存 地 址 分 配 到 适当 总 线 上 。 

2. ReadyDATA: 当 内 存 系统 已 经 把 所 需 的 数据 送 到 总 线 数据 线 上 时 ， 这 条 控制 线 就 会 断言 有 效 。 
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3. ACK: 这 条 控制 线 用 来 指示 ReqREAD 控制 信和 号 或 ReadyDATA 控制 信号 已 经 作 了 应 答 。 

使 用 协议 而 不 是 时 钟 脉冲 来 协调 各 种 事件 的 发 生 ， 意 昧 着 异步 总 线 可 以 在 时 间 控 制 上 与 硬件 技术 
配合 得 更 好 ， 而 且 可 以 支持 更 广泛 的 设备 。 

要 使 用 总 线 ， 设备 必须 占用 总 线 ， 任 意 时 刻 都 只 能 有 一 个 设备 使 用 总 线 。 正 如 前 面 所 述 ， 总 线 主 
控 设 备 是 允许 最 初 的 信息 传递 (控制 总 线 ) 的 设备 ， 而 总 线 受 控 〈 从 ) 设备 是 由 主 控 设备 激活 的 模块 。 
由 于 各 种 从 设备 是 响应 主 控 设备 的 请 求 来 读 写 数 据 ， 所 以 只 有 主 控 设备 可 以 占用 总 线 以 及 为 准备 占用 
而 保留 总 线 。 主 从 设备 使 用 总 线 时 都 必须 遵守 通信 协议 ， 根 据 规定 的 定时 要 求 协调 工作 。 在 某 些 非常 
简单 的 计算 机 系统 (例如 下 面 要 介绍 的 一 个 简单 计算 机 系统 ) 中 ， 常常 只 有 处 理 器 才 是 唯一 的 总 线 主 
控 设 备 。 这 样 做 的 优点 是 可 以 避免 总 线 使 用 上 的 混乱 ， 但 缺点 是 处 理 器 需要 处 理 与 使 用 总 线 有 关 的 所 
有 事件 。 

对 于 配备 不 止 有 一 个 主 控 设备 的 系统 ， 则 需要 总 线 仲裁 (bus arbitration) 机 制 。 总 线 仲裁 机 制 是 
必须 为 某 些 主 控 设备 设 定 一 种 优先 级 别 ， 同 时 又 保证 各 个 主 控 设备 都 有 机 会 使 用 总 线 。 常 用 的 总 线 仲 
裁 方案 可 以 分 为 以 下 4 种 : 

1. 菊花 链 仲裁 方式 : 这 种 方案 是 通过 使 用 一 条 “出 让 总 线 ” (grant bus) 的 控制 线 ， 将 总 线 使 用 
权 依 次 从 最 高 优先 级 别 向 最 低 优先 级 别传 递 。 这 种 方案 不 能 保证 仲裁 的 公平 性 ， 尤 其 是 低 优 先 级 别 的 
设备 可 能 永远 没有 机 会 使 用 总 线 。 这 种 方案 非常 简单 ， 但 是 缺乏 公平 性 。 

2， 集中 式 平 行 仲裁 方式 : 每 个 设备 都 有 一 个 总 线 请 求 控制 线 ， 通 过 一 个 总 线 仲裁 器 来 选择 使 用 总 
线 的 设备 。 采 用 这 种 类 型 的 仲裁 方式 的 缺点 是 可 能 会 导致 总 线 的 使 用 过 程 中 出 现 瓶颈 效应 。 

3. 采用 自选 择 的 分 配 式 仲裁 方式 : 这 种 方案 类 似 于 集中 式 仲裁 ， 但 是 没有 一 个 中 央 仲 裁 器 来 选择 
设备 使 用 总 线 。 而 是 由 设备 自己 来 决定 哪个 设备 具有 使 用 总 线 的 最 高 优先 级 别 。 

4. 采用 冲突 检测 的 分 配 式 仲裁 方式 : 每 个 设备 都 允许 发 出 总 线 使 用 请 求 。 如 果 总 线 检测 到 有 任何 
冲突 ( 即 出 现 多 个 设备 同时 发 出 请 求 )， 这 些 设备 就 必须 重新 发 出 另 一 个 总 线 使 用 请 求 。 以 太 网 络 就 使 
用 这 种 仲裁 方式 。 

第 ?7 章 中 将 更 详细 地 介绍 关于 总 线 和 总 线 协 议 的 内 容 。 


4.1.3 时钟 


每 台 计算 机 都 有 一 个 内 部 时 钟 ， 用 来 控制 指令 的 执行 速度 。 时 钟 也 用 来 对 系统 中 各 个 部 件 的 操作 
进行 协调 和 同步 。 在 进行 时 钟 脉冲 时 ， 系 统 时 钟 会 为 系统 中 所 发 生 的 各 种 事件 设置 步调 ， 就 像 一 个 节 
拍 器 或 交响 乐 的 指挥 一 样 。CPU 使 用 时 钟 信号 来 调控 系统 的 各 个 进程 ， 检 测 系 统 中 的 各 种 数字 逻辑 门 
电路 是 否 会 出 现 其 他 不 可 预测 的 执行 速度 。CPU 的 每 条 指令 执行 都 是 使 用 固定 的 时 钟 脉冲 数目 。 内 
此 ， 计 算 机 通常 采用 时 钟 周 期 〈clock cycle) 数目 来 量度 系统 指令 的 性 能 ， 而 不 是 采用 时 间 秒 。 时 钟 周 
期 是 时 钟 两 次 相 邻 杭 暴 声 ， 即 两 个 相 邻 时 钟 脉冲 之 间 的 时 间 间 隔 。 时 钟 频率 (clock frequency)， 有 时 
称 为 时 钟 速率 或 时 钟 速度 ， 是 采用 MHz 来 测量 的 。 如 第 1 章 所 述 ，1MHz 等 于 每 秒 100 万 周期 ，1Hz 
表示 每 秒 1 个 时 钟 周 期 。 时 钟 周期 时 间 (clock cycle time) ， 或 称 为 时 钟 周期 (clock period)， 就 是 时 钟 
频率 的 倒数 。 例 如 ， 一 台 标 示 800MHz 的 计算 机 的 时 钟 周期 时 间 为 1/800，000，000 秒 , 或 者 说 
1. 25ns。 如 果 机 器 的 周期 时 间 是 2ns， 则 表示 是 一 台 500MHz 的 机 器 。 

大 多 数 计算 机 系统 都 是 同步 计算 机 ， 计算 机 只 有 一 个 主 控 时 钟 信号 ， 主 控 时 钟 按照 规定 的 时 间 间 
隔 发 生 脉动 ， 即 时 钟 脉 冲 发 生 从 0 到 1 然后 从 1 到 0 的 规律 性 变化 。 计 算 机 中 的 各 个 寄存 器 都 必须 等 
待 时 钟 脉冲 发 生 牙 变 才 能 输入 新 的 数据 。 这 样 看 起 来 ， 似 乎 只 要 提高 时 钟 的 速度 ， 计 算 机 就 可 以 运行 
得 更 快 。 但 实际 上 ， 在 设计 时 钟 周 期 时 存在 许多 限制 。 当 时 钟 脉冲 发 生 跃 变 时 ， 各 个 寄存 器 中 会 被 装 
人 新 数据 ， 同 时 寄存 器 的 输出 结果 也 可 能 发 生 改 变 。 这 些 发 生变 化 的 输出 值 必须 通过 系统 中 的 电路 进 
行 传递 ， 直 到 下 一 组 寄存 器 的 输入 端 ， 然 后 存储 于 输入 端 。 因 此 ， 时 钟 的 周期 时 间 必 须 足 够 长 ， 以 保 
证 这 些 改变 可 以 被 传递 到 下 一 组 的 寄存 器 。 如 果 时 钟 的 周期 时 间 太 短 ， 可 能 有 某 些 变化 的 数值 还 未 来 
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得 及 到 达 下 一 组 寄存 器 ， 就 中 止 了 传递 过 程 。 这 样 将 导致 系统 出 现 前 后 矛盾 的 状态 ， 必 须 避 免 这 种 情 
况 。 因 此 ， 最 小 的 时 钟 周期 时 间 至 少 应 该 大 于 数据 从 每 组 寄存 器 的 输出 到 下 一 组 寄存 器 的 输入 所 需要 
的 传递 时 间 ， 即 电路 的 最 大 传输 延迟 时 间 。 现 在 的 问题 在 于 ， 我 们 是 否 可 以 通过 缩短 寄存 器 之 间 的 距 
离 来 减 小 这 种 传输 的 延迟 呢 ? 事实 上 ， 可 以 通过 在 输出 寄存 器 和 对 应 的 输入 寄存 器 之 间 增 加 寄存 器 的 方 
法 来 减 小 传输 延迟 。 注 意 ， 由 于 没有 时 钟 脉冲 的 跃 变 ， 寄 存 器 不 会 改变 其 输出 值 ， 所 以 增加 额外 的 寄存 
器 ， 事 实 上 等 于 增加 了 时 钟 周期 的 数目 。 例 如 ， 原 来 需要 2 个 时 钟 周期 执行 的 一 条 指令 ， 现 在 可 能 会 需 
要 3 个 或 4 个 时 钟 周期 〈 也 可 能 需要 更 多 的 时 钟 周期 ， 这 取决 于 额外 的 寄存 器 的 具体 放置 位 置 ) 。 

大 部 分 计算 机 指令 的 执行 都 需要 1 或 2 个 时 钟 周 期 ， 但 是 某 些 指令 则 可 能 需要 35 个 时 钟 周期 或 者 
更 多 。 下面 的 公式 表示 的 是 CPU 的 时 钟 周 期 和 时 间 秒 的 相互 关系 。 

、 指令 、 
CPU 时 间 一 灾 奋 一 霜 证 入 仿 X 届 

注意 ， 机 器 的 体系 结构 对 计算 机 的 性 能 有 很 大 影响 。 两 台 具 有 相同 时 钟 速度 的 计算 机 并 不 表示 执 
行 指令 时 会 使 用 相同 数目 的 时 钟 周 期 。 例 如 ， 乘 法 操作 在 早期 的 Intel 286 机 器 上 需要 20 个 时 钟 周 期 ， 
但 在 新 款 的 Pentium 机 器 上 ， 只 需 1 个 时 钟 周 期 。 这 就 是 说 ， 即 使 内 部 的 系统 时 钟 速度 相同 ， 新 款 的 
Pentium 机 器 也 要 比 老式 的 286 机 器 快 20 倍 。 一 般 来 说 ， 乘 法 操作 比 加 法 操作 需要 更 多 的 时 钟 周期 ， 
浮 点 运算 比 整数 运算 需要 更 多 的 时 钟 周期 ， 而 访问 存储 器 要 比 访问 寄存 器 需要 更 多 的 时 钟 周期 。 

通常 我 们 所 说 的 时 钟 (clock) 是 指 系统 时 钟 (system clock)， 即 控制 CPU 和 其 他 部 件 的 主 控 时 
钟 。 然 而 ， 某 些 总 线 结 构 也 配 有 自己 的 时 钟 。 总 线 时 钟 (bus clock) 通常 比 CPU 时 钟 慢 ， 这 样 就 造成 
了 系统 的 瓶颈 问题 。 

系统 的 各 个 部 件 都 有 自己 明确 的 性 能 界定 范围 ， 这 些 界定 会 标示 出 实现 这 些 部 件 的 功能 所 需要 的 
最 短 时 间 。 计 算 机 零 部 件 的 制造 商都 可 以 保证 他 们 生产 的 部 件 可 以 在 给 定 的 技术 范围 内 的 最 极端 条 件 
下 正常 工作 。 如 果 把 计算 机 的 各 个 部 件 按 某 种 设计 顺序 连接 起 来 ， 这 种 顺序 安排 会 要 求 某 个 部 件 必 须 
在 另 一 个 部 件 的 动作 前 完成 其 操作 ， 这 样 整个 计算 机 才能 正常 工作 。 因 此 ,各 个 部 件 本 身 的 性 能 界限 
对 于 计算 机 中 各 部 件 的 同步 工作 是 非常 重要 的 。 但 是 ， 许 多 人 常常 会 超越 这 些 技术 限制 ， 以 增强 系统 
的 性 能 。 例 如 ， 超 频 〈overclocking) 运行 就 是 人 们 为 达到 这 种 月 的 经 常 采 用 的 一 种 方法 。 

虽然 许多 部 件 都 可 以 超频 运行 ， 但 是 CPU 是 最 流行 的 超频 组 件 。CPU 超频 的 基本 思想 是 让 CPU 
运行 在 制造 商 规定 给 出 的 时 钟 频率 或 总 线 速度 的 上 限 之 外 。 尽 管 这 样 可 以 增强 系统 的 工作 性 能 ,但 是 
操作 时 需要 特别 小 心 ， 以 避免 造成 定时 同步 方面 的 故障 ， 或 者 更 糟糕 的 是 使 CPU 过 热 。 系 统 总 线 辐 样 也 
可 以 超频 ， 在 系统 的 各 部 件 之 间 通 过 总 线 进行 通信 时 超频 运行 。 对 系统 总 线 的 超频 运行 可 以 大 幅度 改善 
系统 的 性 能 ， 但 是 同样 也 可 能 损害 与 总 线 相连 的 各 种 部 件 ， 或 者 可 能 会 造成 这 些 部 件 的 工作 不 稳定 。 


4.1.4 输入 /输出 子 系统 


人 们 通过 输入 和 输出 设备 (input and output device) 与 计算 机 进行 交流 。 输 入 /输出 是 指 各 种 外 围 
设备 和 主 存储 器 〈 也 称 为 内 存 ) 之 间 的 数据 交换 。 通 过 输入 设备 ,例如 键盘 、 鼠 标 、 读 卡 机 、 扫 措 仪 、 
声音 识别 系统 和 触摸 屏 等 ， 可 以 将 数据 输入 计算 机 系统 。 而 输出 设备 ,例如 显示 器 、 打 印 机 、 绘 图 仪 
和 扬声器 等 ， 则 用 来 从 计算 机 中 获取 信息 。 

输入 输出 设备 通常 并 不 与 CPU 直接 相连 ， 而 是 采用 某 种 接口 〈interface) 来 处 理 数据 交换 。 接 口 
负责 系统 总 线 和 各 外 围 设备 之 间 的 信号 转换 ， 将 信号 变 成 总 线 和 外 设 都 可 以 接受 的 形式 。CPU 通过 输 
入 输出 寄存 器 和 外 设 进行 交流 ， 这 种 数据 的 交换 通常 有 两 种 工作 方式 。 在 内 存 交 换 (映射 ) 的 输入 输 
出 (memory-mapped I/O) 方式 中 ， 接 口中 的 寄存 器 地 址 就 在 内 存 地 址 的 分 配 表 〈 或 称 为 映射 图 ) 中 。 
在 这 种 方式 下 ，CPU 对 I/O 设备 的 访问 和 CPU 对 内 存 的 访问 是 完全 相同 的 。 很 显然 ， 这 种 输入 输出 
方式 的 转换 速度 很 快 ， 但 是 却 需 要 占用 系统 的 内 存 空 间 。 而 对 于 指令 实现 的 输入 输出 〈instruction- 
based I/O) 方式 ，CPU 需要 有 专用 的 指令 来 实现 输入 和 输出 操作 。 尽 管 这 种 工作 方式 不 占用 内 存 空 
间 ， 但 需要 一 些 特殊 的 1/O 指令 ， 也 就 是 只 有 那些 可 以 执行 这 些 特殊 指令 的 CPU 才 可 以 使 用 这 种 输入 
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输出 方式 。 中 断 在 VO 中 扮演 了 非常 重要 的 角色 ， 因 为 中 斯 是 一 种 非常 有 效 的 方法 ， 可 以 通知 CPU 输 
人 或 输出 是 否 已 经 准备 就 绪 。 


4. 1.5 存储 器 组 成 和 寻 址 方式 


第 3 章 中 列举 了 一 个 规模 非常 小 的 存储 器 的 例子 ， 但 是 并 没有 讨论 存储 器 组 成 与 编 址 方式 。 显 然 ， 
很 好 地 理解 这 些 概 念 对 进一步 学 习 计 算 机 的 知识 非常 重要 。 

我 们 可 以 将 存储 器 设想 成 一 个 数据 位 的 阵列 。 阵 列 的 每 一 行 的 位 长 度 通 常 等 于 机 器 的 字 大 小 。 在 
物理 上 ， 我 们 利用 一 个 寄存 器 来 实现 存储 器 阵列 的 一 行 的 数据 存储 。 每 个 寄存 器 (通常 称 为 存储 单元 ， 
memory location) 都 具有 一 个 唯一 的 地 址 编号 。 存储 器 的 地 址 通常 是 从 0 开始 编号 ， 按 顺序 递增 。 
图 4-4 说 明 的 是 存储 器 的 编 址 方式 的 概念 。 
































编 址 < 一 一 8 位 一 一 编 址 4 一 一 16 位 > 
L 人 
: HHH 
4[ 1 [| Li 4 [| 1 | | 
w+ ,HE 时 寺 
a) 六 个 8 位 存储 器 单元 b) M 个 16 位 存储 器 单元 


图 4-4 存储 器 的 编 址 方式 

存储 器 的 地 址 几乎 都 是 采用 无 符号 整数 来 表示 。 第 2 章 讲 过 ; 一 个 4 位 二 进 制 数 称 为 一 个 半 字 
节 ， 而 一 个 8 位 二 进 制 数 称 为 一 个 字 节 。 正 常情 况 下 ， 存 储 器 采用 的 是 按 字 节 编 过 (byte-addressable) 
的 方式 ， 也 就 是 说 每 个 字 节 都 有 一 个 唯一 的 地 址 。 有 些 机 器 的 字 的 大 小 可 能 会 超过 一 个 字 节 。 例 如 ， 

台 计 算 机 能 够 处 理 32 位 字 ， 即 计算 机 可 以 通过 不 同 的 指令 一 次 处 理 32 位 的 二 进 制 数 。 但 是 ， 这 种 

计算 机 可 能 仍然 使 用 的 是 按 字 节 编 址 方式 的 体系 结构 。 在 按 字 节 编 址 的 情况 下 ， 如 果 一 个 机 器 字 使 用 
了 多 个 字 节 ， 那 么 计算 机 将 使 用 最 低地 址 的 字 节 来 决定 整个 字 的 地 址 。 当 然 ， 计 算 机 的 存储 器 也 可 以 
采用 按 字 编 址 (word-addressable) 的 方式 ， 即 每 个 机 器 字 〈 不 是 每 个 字 节 ) 都 具有 一 个 自己 的 唯一 地 
址 。 但是， 现在 大 部 分 流行 的 计算 机 都 是 采用 按 字 节 编 址 的 方式 ， 尽 管 这 些 机 器 使 用 的 是 32 位 或 者 更 
大 的 字 。 通 常 ， 一 个 存储 器 的 地 址 存储 在 一 个 单一 机 器 字 中 。 

如 果 这 里 对 具有 不 同 大 小 字 的 计算 机 仍然 采用 字 节 编 址 方式 的 讨论 使 读者 产生 混淆 ， 那 么 下 面 我 
们 打 个 比方 可 能 会 有 助 于 对 这 些 概 念 的 理解 。 存 储 器 就 好 像 是 一 条 排 满 了 公寓 大 楼 的 街 首 。 每 栋 公 寓 
大 楼 (对 应 于 计算 机 中 的 字 ) 都 配备 若干 套 的 公寓 房间 (相当 于 字 节 )， 每 套 公 寓 房 间 都 有 自己 的 地 址 
编号 。 所 有 这 些 公 寓 大 楼 都 按照 顺序 来 编号 (或 编 址 ) ， 从 0 开始 编号 直到 全 部 公寓 大 楼 的 总 数目 。 这 
些 公寓 大 楼 又 会 对 各 个 房间 进行 分 组 编号 。 计 算 机 中 的 字 实 际 上 起 相同 的 作用 。 计 算 机 的 字 是 各 种 计 
算 机 指令 所 使 用 的 基本 单位 。 例 如 ， 即 使 在 一 台 按 字 节 编 址 的 计算 机 上 ， 我 们 也 可 以 从 内 存 读 出 一 个 
字 或 者 将 一 个 字 写 人 存储 器 。 

如 果 计 算 机 系统 采用 按 字 节 编 址 的 体系 结构 ， 并 且 指 令 系 统 的 结构 字 大 于 一 个 字 节 ， 就 会 出 现 一 
个 所 谓 字 节 对 齐 (alignment) 的 问题 。 例 如 ， 如 果 要 从 一 个 按 字 节 编 址 的 机 器 中 读 出 一 个 32- 位 字 ， 
必须 首先 确定 下 面 的 两 点 内 容 : (1) 这 个 字 是 按照 某 种 自然 对 齐 的 边界 线 来 存储 的 ; (2) 应 该 从 这 个 
对 齐 边 界线 开始 访问 。 对 于 32- 位 字 的 情形 ， 可 以 通过 将 要 查找 的 地 址 乘 以 4 倍 来 实现 上 面 这 种 读 取 方 
式 。 有 些 机 器 允许 以 非 对 齐 的 方式 进行 存储 器 访问 。 在 这 种 情况 下 ， 访 问 所 查询 的 地 址 时 无 需 从 某 个 
自然 对 齐 的 边界 线 开 始 。 

存储 器 〈 指 内 存 ) 由 随机 访问 存储 器 (RAM) 芯片 构成 ， 第 6 章 将 会 详细 讨论 存储 器 。 存 储 器 通 
常 使 用 符号 L XW (长 度 X 宽度 ) 来 表示 。 例 如 ，4M X16 的 存储 器 表示 存储 器 有 4M 长 (具有 
4M 一 22X220 一 22 个 字 ) 和 16 位 宽 〈 每 个 字 都 是 16 位 ) 。 存 储 器 的 宽度 〈 即 上 面 表 示 法 中 的 第 2 个 数 
W) 表示 字 的 大 小 。 要 对 这 个 存储 器 进行 编 址 〈 假 定 按 字 进行 编 址 )， 需 要 有 能 够 唯一 区 分 222 个 不 同 
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内 容 的 项 ， 即 需要 222 个 不 同 的 地 址 。 因 为 地 址 采用 无 符号 的 二 进 制 数 ， 所 以 要 利用 二 进 制 数 从 0 计数 
到 〈222 一 1)。 但 是 ， 这 样 编 址 方法 需要 使 用 多 少 位 的 二 进 制 数 呢 ? 如 果 从 0 计数 到 3 (总 共 4 项 ) 需要 
2 位 二 进 制 数 。 如 果 从 0 计数 到 7 (总 共 8 项 )， 需要 4 位 二 进 制 数 。 依 照 此 规律 ， 读 者 可 以 自己 填写 
表 4-1 中 的 空格 。 


表 4-1 计算 所 求 的 编 址 位 





表 中 正确 的 答案 应 该 是 5 位 。 如 果 计 算 机 有 2N 个 需要 编 址 的 内 存单 位 ， 则 需要 使 用 N 位 二 进 制 数 
来 对 每 个 字 节 进行 无 重复 的 唯一 编 址 。 

主 存储 器 通常 使 用 的 RAM 芯片 数目 大 于 1。 通常 利用 多 块 芯 
片 来 构成 一 个 满足 一 定 大 小 要 求 的 单一 存储 器 模块 。 例 如 ， 利 用 
2K X 8 RAM 的 芯片 构建 一 个 32K. X 16 的 存储 器 ， 可 以 按照 图 
aa 16 行 和 2 列 的 形式 。 

合 芯片 的 每 一 行 可 以 编 址 2K 字 (假定 机 器 是 按 字 编 址 的 )， 
i re 
器 的 编 址 必须 使 用 15 位 二 进 制 数 (需要 访问 的 字 的 数目 为 32K = 
25X 210)。 每 对 芯片 〈 即 组 合 存储 器 的 每 一 行 ) 的 内 部 只 需要 用 
11 根 地 址 线 每 个 芯片 只 能 保持 211 位 字 )。 在 这 种 情况 下 , 需要 图 45 利用 RAM 站 片 组 合 
使 用 一 个 译 码 器 对 地 址 最 左 侧 的 4 位 地 址 进行 译 码 ， 来 决定 是 哪个 构成 存储 器 
芯片 对 存放 了 所 需 的 地 址 。 一 旦 选 定 了 芯片 对 ， 剩 余 的 11 位 地 址 将 被 送 到 另外 一 个 译 码 器 ， 以 确定 该 
芯片 对 中 的 正确 的 地 址 单元 。 

单一 共享 存储 器 模块 可 能 会 引起 存储 器 访问 上 的 顺序 问题 。 存 储 器 交叉 存储 技术 (memory inter- 
leaving)， 即 从 多 个 存储 器 模块 (或 称 为 存储 器 组 ) 中 分 离 存 储 器 单元 的 技术 ， 有 助 于 解决 这 个 问题 。 
交叉 存储 技术 分 为 : 低位 交叉 存储 (low-order interleaving)， 使 用 地 址 的 低位 来 选择 存储 器 组 ; 高 位 
交叉 存储 〈high-order interleaving)， 使 用 地 址 的 高 位 来 选择 存储 器 组 。 

高 位 交叉 存储 是 一 种 更 直观 的 存储 器 组 成 结构 。 利 用 高 位 交叉 存储 技术 ， 可 以 直接 将 地 址 分 配给 
含有 连续 地 址 的 存储 器 模块 。 具 有 32 个 地 址 的 高 位 交叉 存储 方式 如 图 4-6 所 示 。 


模块 0 模块 模块 2 模块 3 模块 4 模块 5 模块 6 模块 7 





0 4 8 12 16 20 24 28 
1 5 13 17 21 2 29 
2 6 10 14 18 22 26 30 
3 7 11 15 19 23 27 31 


图 4-6 高 位 存储 器 的 交叉 存储 

低位 交叉 存储 器 则 将 连续 的 存储 器 地 址 分 配 到 不 同 的 存储 器 模块 中 。 图 4-7 给 出 了 一 个 具有 32 个 
地 址 的 低位 交叉 存储 方式 的 示意 图 。 

使 用 低位 交叉 存储 方式 并 配合 相应 的 总 线 技术 ， 可 以 在 一 个 存储 器 模块 的 读 写 操作 完成 前 ， 就 开 
始 另 一 个 存储 器 模块 的 读 写 操作 。 也 就 是 存储 器 模块 之 间 的 读 写 操作 可 以 相互 重奏 。 | 

上 面 所 讨论 的 有 关 存 储 器 的 概念 非常 重要 ， 这 些 概念 将 会 在 本 书 余下 的 章节 ， 特 别 是 详细 讨论 存 
储 器 的 第 6 章 中 频繁 出 现 。 值 得 关注 的 重要 概念 有 : (1) 存储 器 采用 无 符号 的 二 进 制 数值 进行 编 址 
(而 通常 人 们 所 见 的 却 是 十 六 进 制 的 数值 ， 原 因 是 它 比 较 容 易 记 忆 ); (2) 要 编 址 的 项 目 数 决定 了 出 现 
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图 4-7 低位 存储 器 的 交叉 存储 


在 地 址 中 的 二 进 制 数 的 位 数 。 当 然 ， 也 可 以 采用 比 设计 地 址 要 求 的 更 多 的 位 数 来 进行 编 址 。 但 实际 上 
人 们 很 少 这 样 做 ， 因 为 最 小 化 原则 是 计算 机 设计 中 的 一 个 重要 概念 。 


4.1.6 ”中断 


上 面 已 经 介绍 了 理解 计算 机 体系 结构 所 需要 的 基本 硬件 信息 : CPU、 总 线 、 控 制 单元 、 寄 存 器 、 
时 钟 、I/O 和 存储 器 。 但 是 ， 下 面 还 有 一 个 基本 概念 ， 这 就 是 反映 负责 处 理 计 算 机 中 各 个 部 件 与 处 理 
器 之 间 相 互 作 用 的 概念 : 中 断 (interrupt)。 中 断 就 是 改变 (或 中 断 ) 系统 正常 执行 流程 的 各 种 事件 。 
多 种 原因 可 以 触发 中 断 ， 其 中 包括 : 

。I/O 请 求 

。 出 现 算术 错误 〈 例 如， 被 0 除 ) 

。 算 术 下游 或 上 涪 

。 硬 件 故障 (例如 ， 存 储 器 奇偶 校 验 错误 ) 

。 用 户 定义 的 中 断 点 比如， 程序 调试 过 程 ) 

。 页 面 错误 (第 6 章 将 详细 讨论 ) 

， 非 法 指令 (通常 由 于 指针 间 题 引起 ) 

“其 他 原因 

执行 各 种 中 断 的 操作 称 为 中 断 处 理 ， 不 同 中 断 类 型 的 中 断 处 理 方法 各 有 不 同 。 例 如 ， 通 知 CPU 已 
经 完成 /O 请 求 的 中 断 处 理 与 处 理 被 0 除 产生 的 中 断 过 程 是 完全 不 同 的 。 但 是 ， 这 些 操作 都 是 由 中 断 
来 处 理 的 ， 因 为 这 些 过 程 都 需要 改变 程序 执行 的 正常 流程 。 

由 用 户 或 系统 发 出 (启动 ) 的 中 断 请 求 可 以 是 屏 荐 (maskable〉 中断 (可 以 被 禁止 或 忽略 ) 或 非 
屏 项 〈nonmaskable) 中 断 (高 优先 级 别 的 中 断 ， 不 能 被 禁止 ， 必 须 响应 )。 中 断 可 以 出 现在 指令 中 或 
指令 之 间 ， 可 以 是 同步 中 断 ， 即 与 程序 的 执行 同步 出 现 。 也 可 以 是 异步 中 断 ， 即 随意 产生 中 断 。 中 断 
处 理 可 能 会 导致 程序 的 终止 执行 ， 或 者 当中 断 处 理 完毕 后 程序 会 继续 执行 。 在 4. 3.2 节 和 第 7 章 中 将 
详细 讨论 中 汤 。 

至 此 , 已 经 对 计算 机 系统 的 各 个 主要 的 功能 部 件 作 了 一 般 性 的 介绍 。 下 面 通过 一 个 简单 的 例子 来 
说 明 功 能 、 体 系 结构 这 些 概念 。 


4.2 MARIE 


MARIE， 表 示 一 个 真正 直观 和 简单 的 计算 机 体系 结构 。 它 包括 存储 器 (存储 程序 和 数据 ) 和 CPU (由 
一 个 ALU 和 几 个 寄存 器 组 成 )。 实 际 上 ，MARIE 包含 一 个 实际 的 工作 计算 机 所 具备 的 全 部 功能 部 件 。MA- 
RIE 模型 将 有 助 于 说 明 本 章 和 接 下 来 的 3 章 中 所 介绍 的 一 些 概 念 。 下面 小 节 介 绍 MARIE 的 体系 结构 。 


4.2.1 体系 结构 


MARIE 具有 下 列 特点 : 
“ 使 用 二 进 制 数 和 补 码 表示 法 
。 存储 程序 和 采用 字 长 度 
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* 按 字 (不 是 按 字 节 的 ) 编 址 的 方式 

。 主 存储 器 容量 为 4K 字 〈 即 每 个 地 址 需要 使 用 12 位 二 进 制 数 ) 
，16 位 数据 (16 位 字 ) 

。16 位 指令 、4 位 操作 码 和 12 位 地 址 

* 一 个 16 位 的 累加 器 (AC) 

* 一 个 16 位 的 指令 寄存 器 (IR) 

* 一 个 16 位 的 存储 器 缓冲 寄存 器 (MBR) 
“一 个 12 位 的 程序 计数 器 (PC) 

* 一 个 12 位 的 存储 器 地 址 寄存 器 (MAR) 
“一 个 8 位 的 输入 寄存 器 

* 一 个 8 位 的 输出 寄存 器 

图 4-8 为 MARIE 体系 结构 的 示意 图 。 


存储 器 地 址 0 


OutREG 


存储 器 地 址 4K-1 





在 讨论 其 他 问题 之 前 ， 首 先 强调 存储 器 的 一 个 重要 观点 。 第 3 章 介绍 了 一 个 利用 D 触发 器 构建 的 
简单 存储 器 。 再 次 强调 , ,存储 器 中 的 每 一 个 存储 单元 都 有 一 个 唯一 的 地 址 ;采用 二 进 制 数 来 表示 ， 并 
且 每 个 存储 单元 都 可 以 存放 二 个 数值 。 表 示 存 储 单元 地 址 的 二 进 制 数 常常 很 容易 与 存储 单元 中 存放 的 
内 容 (也 是 一 个 二 进 制 数 ) 混淆 。 为 了 避免 这 种 概念 上 的 混淆 ， 可 以 想像 一 个 有 关 邮 局 的 例子 。 邮 箱 
是 按照 不 同 的 地 址 或 号 码 进行 编排 的 ， 邮 箱 里 面 放 有 邮件 。 如 要 取出 邮件 就 需要 知道 邮箱 的 号 码 。 从 
存储 器 中 提取 数据 或 指令 同样 需要 知道 存储 单元 的 地 址 。 通 过 指定 存储 单元 的 地 址 可 以 处 理 任意 存储 
器 地 址 中 的 内 容 。 读 者 将 会 看 到 有 多 种 不 同 的 方式 来 获取 存储 单元 的 地 址 。 


4.2.2 寄存 器 和 总 线 、 


寄存 器 是 ,CPU 内 部 的 一 些 存 储 单元 (如 图 4-8 所 示 )。CPU 中 的 ALU (算术 逻辑 单元 ) 部 件 负责 
执行 所 有 进程 〈 例 如 算术 和 运算、 逻辑 判断 等 ) 。 执 行程 序 时 ， 寄 存 器 有 着 非常 特殊 的 用 途 : 即 保持 各 种 
暂 存 的 数值 ， 如 正在 用 某 种 方式 处 理 的 各 种 数据 ， 或 者 是 各 种 简单 的 计算 结果 5: 在 许多 情况 下 ， 计 算 
机 对 寄存 器 的 引用 都 隐 含 在 指令 之 中 。 下 面 的 第 4. 2. 3 节 中 ， 在 讨论 MARIE 的 指令 集 时 ， 读 者 将 会 
看 到 这 种 情况 。 


106 第 4 章 

在 MARIE 中 ， 有 下 列 7 种 寄存 器 : 

. AC， 累加 器 (accumulator)， 用 来 保持 数据 值 。 它 是 一 个 通用 寄存 器 (general purpose register)， 

作用 是 保持 CPU 需要 处 理 的 数据 。 现 在 大 部 分 的 计算 机 都 有 多 个 通用 寄存 器 。 
。MAR， 存储 器 地 址 寄存 器 (memory address register) ， 用 来 保持 被 引用 数据 的 存储 器 地 址 。 
。MBR， 存储 器 缓冲 寄存 器 (memory buffer register) ， 用 来 保持 刚 从 存储 器 中 读 取 或 者 将 要 写 人 
存储 器 的 数据 。 

。PC: 程序 计数 器 (program counter) ， 用 来 保持 程序 将 要 执行 的 下 一 条 指令 的 地 址 。 

。IR， 指 令 寄存 器 (instruction register) ， 用 来 保持 将 要 执行 的 下 一 条 指令 。 

.InREG: 输入 寄存 器 (input register) ， 用 来 保持 来 自 输 入 设备 的 数据 。 

。OutREG: 输出 寄存 器 (output register) ， 用 来 保持 要 输出 到 输出 设备 的 数据 。 

MAR、MBR、PC 和 IR 寄存 器 用 来 保持 一 些 专用 信息 ， 并 且 不 能 用 作 上 述 规定 之 外 的 其 他 目的 。 
例如 ， 我 们 不 能 将 来 自 存储 器 的 某 个 任意 的 数据 值 存放 在 PC 寄存 器 中 ， 而 必须 使 用 MBR 或 AC 寄存 
器 来 存放 这 些 任 意 的 数据 值 。 另 外 ， 还 有 一 个 状态 或 标志 寄存 器 (status / flag register)， 用 来 保持 指 
示 各 种 状态 或 条 件 的 信息 ， 例 如 ALU 中 发 生 一 个 溢出 的 信息 。 但 是 ,为 了 使 主要 问题 清晰 起 见 ， 下 
面 所 有 图 中 均 未 包含 该 寄存 器 。 

MARIE 是 一 个 具有 有 限 寄存 器 组 的 非常 简单 的 计算 机 系统 。 现 代 CPU 具有 多 个 通用 寄存 器 ， 用 
来 执行 类 似 AC 的 各 种 功能 。 这 些 通 用 寄存 器 通常 称 为 用 户 可 见 的 寄存 器 (user-visible register) 。 现代 
的 计算 机 系统 还 有 一 些 额 外 的 寄存 器 。 例 如 ， 有 些 
计算 机 具有 可 以 对 数据 值 进行 移 位 的 寄存 器 ; 而 男 
外 还 可 能 有 一 些 寄 存 器 ， 可 以 将 它们 组 合 在 一 起 ， 
用 作 各 种 数据 值 的 列表 。 

MARIE 需要 利用 总 线 来 将 各 种 数据 或 指令 传 
入 和 移出 寄存 器 。 在 MARIE 内 部 ， 我们 假定 使 用 
的 是 一 条 公用 总 线 的 设计 方案 。 每 个 设备 都 被 连接 
到 这 条 公用 总 线 ， 并 且 对 这 些 设备 进行 了 编号 。 在 
各 个 设备 使 用 总 线 之 前 ， 需 先 设置 设备 的 身份 纺 
号 。 还 需要 设计 其 他 的 一 些 通道 来 加 速 程序 的 执 
行 。 在 MAR 和 存储 器 之 间 设 计 一 条 通信 路 线 。 
MAR 通过 这 条 电路 为 存储 器 的 地 址 线 提供 输入 ， 
指示 CPU 要 读 写 的 存储 器 单元 的 位 置 。 另 外 ， 从 
MBR 到 AC 之 间 有 一 条 单独 的 数据 通道 。 从 MBR 
到 ALU 还 有 一 条 特殊 的 通道 ， 允 许 MBR 中 的 数据 
也 可 以 应 用 在 各 种 算术 运算 中 。 同 时 ， 各 种 信息 也 
可 以 从 AC 流 经 ALU， 再 流 回 AC， 而 不 需要 经 过 
公用 总 线 。 采 用 这 三 条 额外 通道 的 好 处 在 于 ， 在 同 
一 个 时 钟 周期 内 ， 既 可 以 将 信息 放置 到 公用 总 线 ， 
又 可 以 同时 将 数据 放置 到 这 些 额 外 的 数据 通道 上 。 
因此 ，MARIE 体系 结构 允许 这 些 事件 并 行 发 生 。 


图 4-9 给 出 了 MARIE 中 的 数据 通路 〈 即 信息 流动 . 
的 通道 ) 的 示意 图 。 图 4-9 MARIE 中 的 数据 通道 





总 线 
0 | 





这 


4.2.3 指令 系统 体系 结构 
MARIE 具有 一 个 非常 简单 ， 但 功能 强大 的 指令 系统 〈 或 称 为 指令 集 )。 计 算 机 的 指令 系统 体系 结 
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构 (instruction set architecture，ISA) 详细 规定 了 计算 机 可 以 执行 的 每 条 指令 及 其 格式 。 从 本 质 上 来 
说 ，ISA 是 计算 机 软件 和 硬件 之 间 的 接口 。 某 些 计算 机 的 指令 系统 体系 结构 常常 包含 几 百 条 指令 。 正 
如 前 面 所 述 ，MARIE 的 每 条 指令 都 由 16 位 二 进 制 数 所 构成 。 指 令 最 左边 的 4 位 ， 从 第 12 位 到 第 15 
位 ， 组 成 机 器 的 操作 码 〈opcode) 。 操 作 码 表示 的 是 要 执行 的 指令 ，MARIE 总 共 可 以 有 16 条 指令 。 而 
右边 的 12 位 ， 第 0 位 到 第 11 位 ， 用 来 形成 一 个 地 址 。 因 此 ， 机 器 允许 的 最 大 存储 器 的 大 小 为 22 一 1。 
MARIE 的 指令 格式 如 图 4-10 所 示 。 






Et 和 汪汪 革 二 


位 15 ee- 12 Wn i 0 
图 4-10 MARIE 的 指令 格式 
大 多 数 ISA 由 处 理 数 据 、 移 动 数据 和 控制 程序 的 执行 序列 的 指令 组 成 。 表 4-2 给 出 了 MARIE 指 
令 集 中 的 各 种 指令 。 
表 4-2 MARIE 的 指令 集 





Do 将 地 址 为 X 的 存储 单元 中 的 内 容 装 人 AC 
oo 将 AC 中 的 内 容 存储 到 地 址 为 X 的 存储 单元 中 
0 将 地 址 为 X 中 内 容 和 AC 中 的 内 容 相 加 ， 然 后 将 结果 存 人 AC 中 


Subt X 将 AC 中 内 容 减 去 地 址 X 中 的 内 容 ， 然 后 将 结果 存 人 AC 中 











Input 从 键盘 输入 一 个 数值 到 AC 中 





_Output 将 AC 中 的 数值 输出 到 显示 器 








Skipcond | 有 条 件 地 跳 过 下 一 条 指令 





Jump X 将 X 的 值 装 和 到 PC 中 


指令 Load 允许 将 数据 从 存储 器 (内 存 ) 装 人 CPU， 此 操作 需要 通过 MBR 和 AC 两 个 寄存 器 来 完 
成 。 来 自 内 存 的 所 有 数据 ( 即 指令 除外 的 其 他 任何 信息 ) 必须 首先 送 到 MBR， 然 后 再 转送 到 AC 或 
ALU， 这 种 体系 结构 并 没有 设计 其 他 的 数据 传送 方案 。 注 意 : 在 Load 指令 中 没有 指明 AC 为 最 终 的 
目的 操作 数 ， 因 为 AC 实际 上 是 隐 含 , (implicit) 在 这 条 指令 中 。 其 他 的 指令 也 以 类 似 的 方式 引用 AC。 
指令 Store 的 作用 是 将 数据 从 CPU 送 回 到 内 存 中。 指令 Adq 和 Subt 则 执行 加 法 和 减法 运算 ， 分 别 将 
AC 中 的 数据 值 加 上 或 减 去 来 自 地 址 为 X 的 存储 器 单元 内 的 数据 值 。 地 址 X 处 的 数据 会 被 复制 到 MBR 
,中 ,并 且 保 存在 MBR 中 直到 算术 操作 执行 完成 。 利 用 Input 和 Output 这 两 条 指令 可 以 实现 MARIE 
和 外 界 的 通信 交流 。 
计算 机 的 输入 和 输出 是 比较 复杂 的 操作 。 现 代 的 计算 机 都 采用 ASCII 编码 字符 的 方式 进行 输入 和 
输出 操作 。 这 就 是 说 ， 如 果 读 者 输入 数字 32， 那 么 计算 机 实际 上 是 先 读 ASCII 字符 “3”， 接 着 再 读 字 
符 “2”。 这 两 个 字符 必须 首先 转换 成 数值 32， 然 后 才能 被 存放 在 寄存 器 AC 中 。 因 为 这 里 我 们 所 关心 
的 是 计算 机 的 工作 原理 ， 所 以 可 以 假定 来 自 键盘 的 输入 值 都 自动 地 进行 了 正确 的 转换 。 这 种 假定 实际 
上 掩盖 了 一 个 非常 重要 的 观念 ， 即 如 果 输 入 或 输出 的 信息 实际 上 是 一 个 ASCI 字符 ， 计 算 机 如 何 识别 
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输入 /输出 的 数值 是 ASCII 字符 还 是 数字 ? 答案 是 ， 计 算 机 是 通过 如 何 使 用 该 数值 的 前 后 信息 来 识别 
的 。 在 MARIE 中 ,假设 输入 和 输出 的 只 有 数字 。 输 入 的 数值 可 以 是 十 进 制 数 ， 同 样 也 假定 有 一 个 
“神奇 的 转换 ”将 输入 的 十 进 制 数 转换 为 计算 机 实际 存储 的 二 进 制 数 。 事 实 上 ， 要 使 计算 机 能 够 正常 运 
转 还 需要 讨论 一 些 问题 。 

Halt 命令 用 于 终止 当前 的 程序 执行 。 指 令 Skipcond 可 以 实现 一 个 条 件 分 支 转移 (就 像 “While” 
循环 语句 或 “if” 语 句 所 执行 的 分 支 转 移 一 样 )。 执 行 Skipcond 指令 时 ， 必 须 检 查 存储 在 AC 中 的 数 
值 。 可 以 利用 地 址 位 中 的 两 位 来 指定 将 要 被 测试 的 条 件 。 这 里 假定 选取 的 是 最 靠近 操作 代码 段 的 两 个 
地 址 位 ， 即 第 10 位 和 第 11 位 。 如 果 两 个 地 址 位 的 值 是 00， 那 么 这 条 指令 就 解释 为 “如 果 AC 中 的 数 
为 负 值 ， 则 执行 跳 转 ”。 如 果 地 址 位 是 01 〈 即 第 11 位 为 0 和 第 10 位 为 1)， 则 指令 解释 为 “如 果 AC 中 
的 数 等 于 0， 执 行 跳 转 ”。 最 后 ， 如 果 两 个 地 址 位 是 10 (或 者 是 2)， 则 表示 “如 果 AC 中 的 数值 大 于 0， 
则 执行 跳 转 ”。 跳 转 “skip” 的 作用 就 是 简单 地 跳 过 下 一 条 指令 。 这 种 跳 转 操作 可 以 通过 将 PC 指针 加 
1 来 实现 ， 实 际 上 就 是 忽略 紧 接 下 来 的 指令 ， 不 再 对 这 条 指令 执行 取 指 操作 。Jump 指令 是 一 条 无 条 件 
跳 转 指令 ， 它 同样 会 影响 PC 指针 。Jump 指令 是 用 X 的 值 来 替换 PC 中 的 数值 ， 作 为 下 一 条 要 取 指 的 
指令 地 址 。 

本 例 的 目的 是 既 要 保持 体系 结构 和 指令 集 尽 可 能 简单 ， 同 时 又 要 传达 那些 了 解 计 算 机 工作 原理 的 
必要 信息 。 因 此 ， 这 里 我 们 忽略 了 用 个 有 用 的 指令 。 但 是 ， 读 者 马上 就 会 发 现 这 套 指 令 集 的 功能 还 是 
非常 强大 的 。 一 旦 熟悉 了 计算 机 的 工作 原理 ， 就 可 以 对 这 个 指令 集 进 行 扩充 ， 这 样 可 以 使 编程 更 加 
方便 。 

下 面 来 研究 MARIE 所 使 用 的 指令 格式 ， 假 定 MARIE 有 如 下 形式 的 16 位 指令 : 


操作 码 地 址 
EE—==3 


| | 
olfolol lolololololololololol ls 


位 1514131211109 876543210 


最 左边 的 4 位 表示 操作 码 ， 也 就 是 要 执行 的 指令 。0001 是 1 的 二 进 制 数 ， 代 表 指 令 Load。 余 
下 的 12 位 表示 指令 要 装 人 的 数值 的 地 址 ， 这 里 代表 的 是 主 存储 器 中 的 第 3 个 地 址 。 上 面 这 条 指令 
的 意义 是 将 位 于 主 存储 器 中 地 址 为 3 的 存储 单元 中 的 内 容 复制 到 AC 寄存 器 。 下 面 再 讨论 另外 一 
条 指令 : 


操作 码 地 址 
人 一 


机 
olol lolofolololololol lel 


位 1514131211109876543210 


最 左边 的 4 位 为 0011， 等 于 3， 这 是 一 条 (add) 加 法 指令 。 地 址 位 的 数值 ， 如 果 按 十 六 进 制 数 ， 
表示 的 是 地 址 00D (或 者 是 十 进 制 数 13) 。 这 条 指令 的 意义 是 到 主 存储 器 中 地 址 为 00D 的 存储 单元 中 
取出 数据 值 ， 然 后 与 AC 中 的 数据 值 相 加 。 得 到 的 结果 (和) 又 被 送 回 AC 中 ， 蔡 代 AC 中 原来 的 数 
值 。 下面 再 举 一 个 例子 : 


操作 码 地 址 
[wi 


TF A A A SE 7 | 


位 1514131211109876543210 
这 条 指令 的 操作 码 表 示 指 令 Skipcond。 指 令 的 第 10 位 和 第 11 位 〈 从 左 往 右 读 ) 为 10， 表 示 数 


值 2。 这 条 指令 的 含义 为 “如 果 AC 中 的 值 大 于 0， 则 执行 跳 转 ”。 如 果 AC 中 的 数值 小 于 0， 将 忽略 该 
指令 ， 程 序 简单 地 继续 执行 下 一 条 指令 。 但 是 ， 如 果 AC 中 的 数值 大 于 0 或 等 于 0， 则 这 条 指令 会 使 
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PC 寄存 器 中 的 值 增 量 加 1， 导 致 忽略 程序 中 紧 跟 在 这 条 指令 后 面 的 指令 (在 阅读 有 关 指 令 周 期 时 请 务 
必 牢 记 这 一 点 ) 。 

这 个 例子 中 最 令 人 感 兴趣 的 内 容 是 将 使 用 这 些 有 限 的 指令 集 来 编写 程序 。 不 知道 读者 是 喜欢 采用 
命令 Load、Add 和 Halt， 还 是 喜欢 使 用 与 这 些 命令 等 效 的 二 进 制 数 0001、0011 和 0111 来 编写 程序 
呢 ? 一般 说 来 ， 大 多 数 人 编程 时 都 喜欢 使 用 指令 的 名 称 ， 或 者 说 助 记 符号 (mnemonic)， 而 不 是 二 进 
制 数值 的 指令 。 二 进 制 指令 又 称 为 机 器 指令 〈machine instruction) 。 而 对 应 的 助 记 符号 指令 则 称 为 汇 
编 语言 指令 (assembly language instruction ) 。 汇编 语言 和 机 器 指令 之 间 存 在 着 一 一 对 应 关系 。 当 使 用 
汇编 语言 编写 程序 时 (即使 用 表 4-2 中 列 出 的 各 种 指令 )， 需 要 使 用 一 个 汇编 程序 (又 称 为 编译 器 ) 将 
汇编 语言 转换 成 对 应 的 二 进 制 命令 。 有 关 编 译 器 的 内 容 将 在 第 4. 5 节 进 行 讨论 。 


4.2.4 寄存 器 传输 表示 法 


数字 计算 机 系统 由 许多 基本 部 件 组 成 ， 包 括 算术 逻辑 单元 、 寄 存 器 组 、 存 储 器 、 译 码 器 和 控制 单 
元 等 。 这 些 单元 通过 总 线 相互 连接 ， 各 种 信息 可 以 通过 总 线 在 系统 中 传递 流动 。MARIE 中 的 指令 集 实 
际 上 是 这 些 计 算 机 部 件 用 来 执行 程序 的 一 组 机 器 级 别 的 指令 系统 。 这 些 指令 看 起 来 非常 简单 ， 但 如 果 
仔细 研究 在 机 器 部 件 级 别 上 这 些 指 令 的 实际 执行 过 程 ， 不 难 发 现 每 条 指令 实际 上 都 包含 多 个 操作 。 例 
如 ，Load 指令 的 作用 是 将 给 定 的 存储 器 单元 中 的 内 容 装 人 AC 寄存 器 中 。 但 是 ， 如 果 仔 细 观 察 这 条 指 
令 在 机 器 部 件 级 别 的 执行 过 程 ， 可 以 发 现 这 条 指令 实际 上 包含 了 多 个 “ 微 指令 《mini-instruction)” 的 
执行 过 程 。 首 先 ， 指 令 所 指定 的 地 址 必须 先 装 到 MAR 寄存 器 。 然 后 将 位 于 该 地 址 的 存储 单元 中 的 数 
据 装 入 MBR 寄存 器 。 接 着 MBR 中 的 内 容 被 传送 至 AC 寄存 器 。 这 些微 指令 又 称 为 微 操作 (microop- 
eration) 。 微 指令 规定 了 对 寄存 器 中 存储 的 数据 可 以 执行 各 种 最 基本 的 操作 。 

描述 计算 机 微 操作 的 行为 的 符号 表示 法 称 为 寄存 器 传输 表示 法 (register transfer notation， 
RTN) ， 或 者 称 为 寄存 器 传输 语言 (register transfer language，RTL)。 在 这 种 表示 法 中 ， 我 们 使 用 符 
号 M [Xj] 表示 存放 在 地 址 为 X 处 的 存储 单元 中 的 数据 ， 而 符号 对 表示 信息 的 传送 。 实 际 操作 中 ， 寄 
存 器 之 间 的 数据 传送 包含 下 面 两 个 步骤 ， 数据 先 从 源 寄存 器 传送 至 总 线 ， 然 后 脱离 总 线 传送 到 目的 寄 
存 器 。 但 是 ， 为 了 清晰 起 见 ， 下 面 的 叙述 中 没有 包括 总 线 的 传送 过 程 ， 而 是 假定 读者 已 经 了 解 了 数据 
的 传送 必须 涉及 到 总 线 周 期 。 

下 面 介绍 MARIE 的 指令 系统 中 每 条 指令 的 寄存 器 传输 表示 法 。 





这 条 指令 是 将 存储 单元 X 中 的 内 容 装 到 AC 寄存 器 。 首 先 必须 将 地 址 X 放 入 到 MAR 中 。 接 着 ， 
将 单元 M [MAR] (或 地 址 X) 的 数据 移动 至 MBR 中 。 最 后 ， 将 这 个 数据 移 人 AC 寄存 器 中 。 

MRR 一 X 

MBR ¢— M [MAR], AC €— MBR 


因为 在 地 址 X 处 的 存储 单元 中 的 数据 被 装 入 到 MBR 之 前 ， 指 令 寄存 器 〈IR) 需要 使 用 总 线 来 复 
制 X 的 值 到 MAR， 所 以 这 个 操作 需要 两 个 总 线 周期 。 很 明显 ， 这 两 个 操作 分 别 属于 不 同 的 操作 线路 ， 
这 表示 它们 不 能 在 同一 个 总 线 周期 内 发 生 。 然 而 ， 由 于 在 MBR 和 AC 之 间 设 置 有 专门 的 连接 通路 ， 所 
以 从 MBR 到 AC 的 数据 传送 可 以 在 数据 被 放 入 MBR 后 立刻 进行 ， 而 不 必 等 待 总 线 周期 。 


tore X 
使 用 这 条 指令 可 以 将 AC 中 的 内 容 存放 到 地 址 X 处 的 存储 器 单元 中 。 


MAR €- X MBR ~ AC 





M [MAR] 一 MBR 


将 存储 在 地 址 X 处 的 数据 值 加 到 AC 累加 器 中 。 指 令 执行 的 过 程 如 下 : 
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MAR CX 
MBR 和 M[MAR] 


AC 《一 AC + MBR 


SEEA 
类 似 于 adad 指令 ， 从 累加 器 中 减 去 存储 在 地 址 X 处 的 数值 ， 然 后 将 计算 结果 返回 到 AC 中 


MARC X 
MBR ~ MI[MAR] 


RAC《- AC 一 MBR 


[TI 
这 条 指令 的 功能 是 将 来 自 输 入 设备 的 任何 输入 数据 首先 发 送 到 InREG 寄存 器 ， 然 后 再 转移 到 AC 
" AC € INREG 
Cutout 
这 条 指令 是 将 AC 中 的 内 容 先 放 到 寄存 器 OutREG， 然 后 发 送 到 输出 设备 上 。 
OUutREG€- AC 
Halt 
没有 与 寄存 器 有 关 的 操作 ， 该 指令 简单 地 使 机 器 终止 程序 的 执行 。 


Spcond 
记 住 这 一 指令 使 用 地 址 域 中 位 10 和 位 11 的 两 位 来 决定 对 累加 器 AC 所 进行 的 比较 运算 。 根 据 这 
两 个 位 的 不 同 组 合 ， 机 器 会 检查 AC 中 的 数值 ， 决 定 这 个 数值 是 否 为 负数 ， 等 于 0, 或 者 是 大 于 0。 如 
果 给 定 的 条 件 为 真 ， 则 会 跳 过 下 一 条 指令 。 这 种 跳 转 操作 是 通过 将 PC 寄存 器 中 的 指针 进行 增 量 加 1 
来 实现 的 。 
If IR[11-10]=00 then {if bits 10 and 11 in the IR are both 0} 
If AC < 0 then PC 和 PC+1 
else If IR[11-10]=01 then {if bit 11 = 0 and bit 10 = 1} 
IE AC = 0 then PC PC + 工 
else If IR{11-10]= 10 then {1f bit 11 = 1 and bit 10 = 0} 
If AC > 0 then PC¢- PC+1 
如 果 第 10 位 和 第 11 位 都 为 1， 就 会 产生 一 个 错误 条 件 。 当 然 ， 也 可 以 利用 这 两 位 都 为 1 值 来 定义 
另外 一 个 条 件 跳 转 。 
Jurnb X 
指令 执行 一 个 转向 给 定 地 址 X 处 的 无 条 件 分 支 转 移 。 所 以 ， 在 执行 这 条 指令 时 ， 地 址 X 必须 先行 
装 人 到 PC 中 。 
PC COX 
事实 上 ， 指 令 寄存 器 中 的 低 12 位 或 者 说 最 右边 的 12 位 (或 下 [11-0]) 表示 的 是 地 址 X 的 值 。 所 
以 这 种 转移 可 以 更 准确 地 描述 为 : 
PC《-IR [11-0] 
但 是 ， 也 许 读者 会 觉得 符号 PC 人 - x 更 容易 理解 ， 并 且 与 实际 的 指令 相关 联 。 所 以 一 般 使 用 这 种 
表示 方法 。 
寄存 器 传输 表示 法 〈(RTN) 属于 一 种 符号 表示 方法 。 它 所 表示 的 是 ， 在 执行 特定 的 指令 时 计算 机 
系统 内 部 所 发 生 的 各 种 过 程 。 寄 存 器 传输 表示 法 与 数据 通路 有 关 。 如 果 存 在 多 个 微 操 作 必 须 共 用 总 线 
的 话 ， 那 么 微 操作 必须 按照 顺序 安排 的 方式 ， 逐 个 执行 。 
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4.3 指令 的 执行 过 程 


至 此 ， 我 们 已 经 介绍 了 一 种 基本 的 计算 机 语言 。 利 用 这 种 语言 ， 可 以 进行 人 机 对 话 。 下 面 讨 论 特 
定 程序 的 执行 过 程 。 现 在 所 有 的 计算 机 系统 都 遵循 一 个 基本 循环 过 程 : 取 指 、 译 码 和 执行 周期 。 


4.3.1 取 指 - 译 码 -执行 周期 


取 指 - 译 码 -执行 (fetch-decode-execute) 表示 计算 机 运行 程序 时 所 遵循 的 步骤 。CPU 首先 提取 一 
条 指令 ， 即 将 指令 从 主 存储 器 转移 到 指令 寄存 器 ;接着 对 指令 进行 译 码 ， 即 确定 指令 的 操作 码 和 提取 
执行 该 指令 所 需 的 数据 ; 然后 执行 这 条 指令 ， 即 执行 指令 规定 的 各 种 操作 。 注 意 ， 在 这 个 循环 过 程 中 ， 
计算 机 的 大 部 分 工作 都 是 在 执行 从 一 个 单元 将 数据 复制 到 另 一 个 单元 的 任务 。 当 一 个 程序 最 初 被 装 人 
到 CPU 时 ， 第 一 条 指令 的 地 址 也 必须 被 装 人 
PC 中。 下 面 列 出 了 计算 机 工作 周期 的 各 个 步 
又 ， 即 特定 时 间 周 期 内 发 生 的 各 种 操作 。 步 又 
1 和 步 又 2 组 成 了 取 指 过 程 ， 步 又 3 表示 译 码 
过 程 ， 步 又 4 则 是 执行 过 程 。 
1. 将 PC 中 的 内 容 复制 到 MAR: MAR4-PC。 
2. CPU 转向 主 存储 器 ， 提 取 由 MAR 给 出 
的 地 址 单元 中 的 指令 ， 并 将 指令 放 和 指令 寄存 
器 IR 中。 同时 ，PC 自动 加 1， 现 在 PC 指向 程 
序 的 下 一 条 指令 : IRC-M [MAR] 和 PCC~PC+1。 
注意 ， 因 为 MARIE 是 按 字 编 址 的 ， 所 以 PC 
增 量 加 1 所 产生 的 实际 效果 是 下 一 个 字 的 地 址 
将 占据 PC 寄存 器 。 如 果 MARIE 是 按 字 节 编 
址 的 ， 则 PC 需要 增 量 加 2 才能 指向 下 一 条 指 
令 的 地 址 ， 原 因 是 每 条 指令 占有 两 个 字 节 的 宽 
度 。 而 如 果 MARIE 是 一 个 32 位 字 的 按 字 节 编 需要 


址 的 计算 机 系统 ， 则 PC 需要 进行 增 量 加 4 的 
复制 MAR 地 址 的 
而 疾 内 和 到 MBR 






起 1-0] es 


操作 。 

3. 将 IR 中 最 右边 的 12 位 复制 到 MAR; 
并 对 IR 最 左边 的 4 位 进行 译 码 ， 以 确定 操作 
码 : MARG-IR [11-0] 和 译 码 IR [15-12]。 

4. 如 果 需 要 ，CPU 将 使 用 MAR 中 的 地 址 
转向 存储 器 提取 数据 ， 并 将 数据 放 入 MBR 
(可 能 是 AC) 中 ， 然 后 执行 该 指令 : MBR 仁 M 
[MAR] ， 并 且 执 行 实际 的 指令 。 

计算 机 执行 程序 的 这 一 循环 过 程 可 以 采用 
流程 图 的 形式 来 表示 ， 如 图 4-11 所 示 。 

注意 ， 现 代 的 计算 机 系统 ， 具 有 庞大 的 指令 集 、 超 长 的 指令 和 巨大 的 存储 器 系统 ， 可 以 在 瞬间 执 
行 几 百 万 个 这 种 取 指 - 译 码 -执行 的 循环 过 程 。 


4.3.2 中 断 和 输入 /输出 


第 7 章 将 详细 讨论 输入 和 输出 。 这 里 只 介绍 有 关 输 入 /输出 〈IMO) 的 基本 概念 ， 读 者 可 以 对 程序 
执行 的 全 过 程 有 一 个 清晰 的 了 解 。 


图 4-11 取 指 - 译 码 -执行 周期 
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MARIE 有 两 个 寄存 器 负责 处 理 输入 和 输出 操作 。 输入 寄存 器 保持 由 输入 设备 传送 到 计算 机 的 数 
据 ; 输出 寄存 器 则 是 保持 准备 传送 到 输出 设备 的 各 种 信息 。 从 物理 上 来 说 ， 这 两 个 寄存 器 所 使 用 的 定 
时 机 制 非常 重要 。 例 如 ， 如 果 采 用 键盘 输入 ， 并 且 打字 的 速度 很 快 时 ， 计算 机 必须 有 足够 的 时 间 来 阅 
读 输 入 到 输入 寄存 器 的 每 一 个 字符 。 如 果 在 计算 机 能 够 有 机 会 处 理 完 当 前 的 字符 之 前 ， 又 有 另外 一 个 
字符 被 送 入 到 输入 寄存 器 ， 那 么 当前 的 那个 字符 就 会 丢失 。 一 种 更 可 能 发 生 的 情况 是 ， 由 于 处 理 器 的 
速度 非常 快 ， 而 键盘 输入 的 速度 很 慢 ， 所 以 处 理 器 可 能 会 多 次 从 寄存 器 重复 读 取 同一 个 字符 。 事 实 上 ， 
必须 避免 这 两 种 情况 发 生 。 

在 MARIE 模型 中 ， 使 用 中 断 控制 的 输入 给 出 (interrupt-driven I/O) 来 解决 上 述 这 些 问题 (有关 
各 种 类 型 的 1/O 机 制 的 详细 讨论 ， 读者 可 以 参见 第 7 章 的 内 容 )。 当 CPU 要 执行 输入 或 输出 指令 时 ， 
首先 通知 相应 的 I/O 设备 。 然 后 ， 继 续 处 理 其 他 的 一 些 工 作 任务 ， 直 到 该 IO 设备 准备 就 绪 。 这 时 ， 
I/O 设备 会 向 CPU 发 送 一 个 中 断 请 求 信号 。 随 后 ，CPU 会 响应 和 处 理 这 个 中 断 请 求 。 完 成 输入 或 输出 
操作 后 ，CPU 会 继续 其 正常 的 取 指 - 译 码 -执行 周期 。 这 一 具体 的 处 理 过 程 如 下 : 

。CPU 收 到 一 个 来 自 VO 设备 的 信号 〈 中 断 信号 ) ， 表 示 输 入 或 输出 的 准备 工作 已 经 完成 。 

。 利用 某 些 方法 可 以 使 CPU 从 正常 的 取 指 - 译 码 -执行 周期 转 去 “识别 ”这 个 中 断 请 求 。 

大 部 分 的 计算 机 所 采用 的 中 断 处 理 方法 是 : 在 机 器 的 每 一 个 取 指 - 译 码 -执行 周期 开始 处 ， 首先 检 
查 是 否 有 中 断 请 求 存在 。 如 果 有 中 断 请 求 ，CPU 先 处 理 中 断 任务 。 中 断 处 理 完 成 后 ，CPU 会 继续 进行 
机 器 的 指令 执行 过 程 。 如 果 没 有 发 现 中 断 请 求 ，CPU 则 进行 正常 的 程序 执行 过 程 。 中 断 处 理 过 程 的 流 
程 图 如 图 4-12 所 示 。 






执行 
取 指 - 译 码 -执行 周期 


图 4-12 为 检查 中 断 请 求 而 修正 的 指令 周期 

通常 情况 下 ， 输 入 或 输出 设备 使 用 一 个 特殊 的 寄存 器 、 状 态 或 标志 寄存 器 ， 来 发 送 中 断 信号 。 通 
过 在 这 个 寄存 器 中 设置 某 个 特殊 的 二 进 制 位 来 表示 有 一 个 中 断 请 求 产 生 。 例 如 ， 只 要 键盘 输入 开始 ， 
这 个 特殊 的 位 就 会 被 设置 为 1。CPU 会 在 每 个 机 器 周期 的 开始 处 ， 自 动 检查 该 位 的 状态 。 如 果 发 现 该 
位 已 经 被 设置 为 1，CPU 就 会 转 去 处 理 中 断 过 程 。 如 果 未 设置 该 位 ， 则 CPU 执行 正常 的 取 指 - 译 码 - 执 
行 周期 ， 继 续 处 理 当前 运行 的 程序 中 的 指令 。 

如 果 CPU 发 现 中 断 位 被 设置 ， 就 会 执行 中 断 处 理 任务 。 中 断 处 理 的 具体 任务 是 由 所 产生 的 中 断 
的 类 型 决定 的 。 输 入 /输出 中 断 并 不 是 程序 执行 过 程 中 可 能 产生 的 唯一 的 中 断 类 型 。 读者 是 否 使 用 过 
键入 “CtrLbreak” 或 “CtrL-C” 来 终止 一 个 程序 ? 这 就 是 另外 一 种 类 型 的 中 断 的 例子 。 计算 机 中 有 三 
种 类 型 的 中 断 : 由 外 部 事件 比如 输入 /输出 ,或 电源 掉 电 等 ) 产 生 的 外 部 中 断 ; 由 于 程序 中 的 一 些 
异常 情况 例如， 被 0 除 ， 堆 栈 溢出 ， 或 保护 系统 侵犯 等 ) 产生 的 内 部 中 断 以 及 执行 程序 中 的 某 条 
指令 〈 例 如 ， 要 求 程序 的 执行 从 一 种 运行 环境 ， 如 用 户 层 ， 转 到 另 一 个 运行 环境 ， 如 内 核 层 等 ) 所 
引起 的 软件 中 断 。 
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不 管 是 哪 种 类 型 的 中 断 调用 ， 中 断 处 理 过 程 都 是 相同 的 。 当 CPU 识别 一 个 中 断 请 求 时 ， 就 能 确定 
中 断 服务 程序 的 地 址 (通常 由 硬件 决定 )， 并 且 执 行 这 一 中 断 服务 的 程序 (非常 类 似 于 一 个 普通 的 程序 
进程 )。CPU 会 从 原来 的 程序 运行 转 去 执行 某 个 特殊 的 程序 进程 来 处 理 中 断 。CPU 处 理 中 断 服务 程序 ， 
也 是 对 各 种 中 断 指 令 执行 正常 的 取 指 - 译 码 -执行 周期 ， 直 到 所 有 的 中 断 程 序 编码 运行 完毕 。 然 后 ， 
CPU 又 会 返回 到 中 断 发 生前 所 运行 的 程序 位 置 。CPU 必须 严格 返回 到 中 断 处 理 前 的 原始 程序 的 运行 位 
置 。 因 此 ， 当 CPU 要 去 执行 中 断 服务 程序 时 ， 必 须 先 存储 PC 中 的 内 容 ，CPU 的 所 有 寄存 器 中 的 内 
容 ， 以 及 原始 程序 中 原 有 的 各 种 状态 条 件 。 而 在 中 断 服务 程序 完成 后 ，CPU 必须 严格 恢复 到 原始 程序 
运行 的 真实 环境 ， 然 后 又 开始 对 原来 运行 的 程序 进行 取 指 、 译 码 和 执行 指令 的 操作 。 


4.4 一 个 简单 的 程序 


下 面 介 绍 为 MARIE 模型 编写 的 一 个 简单 的 程序 。 第 4. 6 节 将 列举 另外 几 个 例子 来 展示 这 一 微型 
计算 机 体系 结构 的 强大 功能 。MARIE 模型 甚至 可 以 运行 一 些 包含 各 种 进程 、 循 环 结构 和 不 同 选项 的 
程序 。 

第 一 个 程序 是 实现 两 个 数 的 相 加 〈 这 两 个 加 数 均 位 于 主 存储 器 中 ) ， 并 将 求 和 结果 存储 在 存储 器 中 
(暂时 不 考虑 输入 /输出 )。 

表 4-3 列 出 了 实现 上 述 加 法 操作 的 汇编 语言 程序 ， 及 其 对 应 的 机 器 语言 程序 。 指 令 栏 中 列 出 的 指 
令 序列 就 是 实际 的 汇编 语言 程序 。 我 们 知道 ， 程 序 的 运行 是 从 提取 第 一 条 程序 指令 开始 进入 取 指 - 译 码 
-执行 周期 的 。 因 此 ， 当 装 入 程序 开始 执行 时 ， 首 先 要 将 第 一 条 指令 的 地 址 装 人 到 PC 中 。 为 简单 起 见 ， 
这 里 假定 在 MARIE 模型 中 运行 的 程序 总 是 从 地 址 100 (十 六 进 制 ) 开始 装 人 内 存 的 。 


表 4-3 ”实现 两 个 数 相 加 的 一 个 简单 程序 






0001000100000100 
0011000100000101 
0010000100000110 
0111000000000000 
0000000000100011 
1111111111101001 
0000000000000000 








101 
102 
103 
104 
105 


表 中 存储 器 地 址 的 三 进 制 内 容 一 栏 列 出 的 指令 序列 就 是 实际 的 机 器 语言 程序 。 因 为 十 六 进 制程 序 
要 比 二 进 制程 序 更 易于 阅读 ， 所 以 存储 器 中 的 实际 内 容 也 都 用 十 六 进 制 数 的 方式 。 

程序 首先 将 位 于 地 址 104 的 存储 单元 中 的 第 一 加 数 002316 (十 进 制 数值 为 35) 装 入 AC 中 。 然 后 
加 上 地 址 105 的 十 六 进 制 数值 FFE9 (十 进 制 数 为 一 23)。 求 和 的 计算 结果 为 12， 并 且 被 放 回 到 AC 中 。 
Store 指令 会 将 这 个 求 和 结果 存储 到 地 址 为 106 的 存储 单元 中 。 当 程序 运行 完毕 后 ， 地 址 106 的 存储 
单元 的 内 容 就 变 成 了 0000000000001100， 十 六 进 制 数 是 000C， 或 十 进 制 数 12。 图 4-13 给 出 了 程序 执 
行 的 具体 步 又， 以 及 对 应 的 各 个 寄存 器 中 的 内 容 。 

图 中 部 分 c 的 最 后 一 条 RTN 指令 是 将 求 和 结果 放 到 指定 的 存储 单元 。“decode IR [15-12]” 语 名 
只 表示 必须 对 指令 进行 译 码 ， 才 能 决定 计算 机 所 要 执行 的 操作 。 译 码 过 程 可 以 利用 软件 (使 用 一 个 微 
程序 ) 或 者 硬件 (使 用 硬 连 线 的 电路 ) 来 实现 。 这 两 个 译 码 方法 将 在 第 4. 7 节 详 述 。 
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图 4-13 ”两 个 数字 相 加 的 程序 的 具体 执行 过 程 


注意 ， 汇 编 语言 和 机 器 语言 指令 之 间 存在 着 一 一 对 应 的 关系 。 利 用 这 种 对 应 关系 可 以 很 方便 地 进 
行 汇编 语言 和 机 器 代码 之 间 的 转换 。 利 用 本 章 给 出 的 指令 列表 ， 读 者 可 以 对 本 章 举例 中 的 各 个 程序 进 
行 编译 处 理 。 基 于 这 种 理由 ， 我 们 在 以 后 的 介绍 中 ， 只 讨论 汇编 语言 代码 。 但 是 ， 在 列举 更 多 的 例子 
之 前 ， 我 们 先 来 讨论 程序 的 编译 过 程 。 


4.5 有 关 编 译 程序 的 讨论 


对 于 表 4. 3 中 的 程序 ， 将 汇编 语言 指令 (例如 Load 104) ， 转 换 成 机 器 语言 指令 1104〈 十 六 进 制 ) 
很 简单 。 但 是 ， 为 什么 要 为 这 种 语言 之 间 的 转换 而 烦恼 呢 ? 为 什么 不 直接 采用 机 器 代码 来 编写 程序 ? 
虽然 对 计算 机 来 说 ， 阅 读 二 进 制 指令 的 效率 是 非常 高 的 。 但 是 ， 对 我 们 来 说 ， 要 理解 这 些 由 0 和 1 序 
列 组 成 的 程序 却 是 一 件 十 分 困难 的 事情 。 我 们 宁愿 使 用 单词 和 符号 ， 而 不 愿意 去 阅读 那些 长 串 的 二 进 
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制 数字 。 因 此 ， 设 计 一 个 程序 来 完成 这 种 简单 的 转换 工作 ， 似 乎 是 一 种 很 自然 的 解决 方案 。 这 样 的 程 
序 称 之 为 编译 程序 (assembler) 。 


4. 5. 1 编译 程序 的 功能 


编译 程序 的 任务 就 是 使 用 助 记 符 号 将 汇编 语言 转换 成 机 器 语言 ， 即 完全 由 二 进 制 数 ， 或 者 说 完全 
由 0 和 1 的 数字 串 组 成 的 语句 。 编 译 程序 首先 阅读 程序 员 编 写 的 汇编 语言 程序 ， 这 些 汇 编程 序 实 际 上 
是 一 些 二 进 制 数 的 符号 表示 形式 。 然 后 ， 将 这 些 汇 编程 序 转换 成 二 进 制 的 指令 ， 或 者 说 是 对 应 的 机 器 
代码 。 这 里 ， 编 译 程序 阅读 的 是 由 汇编 语言 编写 的 源 文件 (source file)， 生 成 的 是 由 机 器 代码 组 成 的 目 
标 文件 (object file)。 

利用 简单 的 字母 名 称 来 替代 操作 码 会 使 编程 变 得 更 容易 。 同 样 ， 可 以 使 用 标记 符号 (label) (简单 
名 称 ) 来 标识 或 命名 一 些 特 定 的 存储 器 地 址 ， 这 使 编写 汇编 程序 的 工作 变 得 更 简单 。 例 如 ， 在 上 面 介 
绍 的 两 个 数字 相 加 的 程序 中 ， 就 可 以 使 用 标记 符号 来 代表 存储 器 地 址 ， 这 样 在 编程 时 我 们 无 需 直 接 知 
道 指令 中 各 操作 数 的 具体 的 存储 器 地 址 。 表 4-4 说 明 的 就 是 这 样 一 种 概念 。 

如 果 指 令 的 地 址 域 放 置 的 是 一 个 标记 符号 (简称 为 标号 )， 表 4-4 使 用 标识 符号 的 例子 
而 不 是 真实 的 物理 地 址 ， 编 译 程序 仍然 必须 将 其 翻译 成 主 存储 器 3 yh 
中 的 真实 物理 地 址 。 大 多 数 汇编 语言 都 允许 使 用 标记 符号 。 通 常 
编译 程序 会 规定 各 种 指令 的 所 遵从 的 格式 法 则 ， 其 中 包括 有 关 标 
记 符号 的 各 种 规定 。 例 如 ， 可 以 规定 标号 限制 为 3 个 字符 ， 同 样 
也 可 以 要 求 标号 出 现在 指令 的 第 一 个 位 置 上 〈 域 )。MARIE 则 要 
求 标号 后 面 必须 要 加 一 个 “,” 的 标点 符号 。 

标号 对 编程 人 员 来 说 非常 方便 。 但 是 ， 对 编译 程序 而 言 ， 标 
号 的 翻译 却 需要 花费 更 多 步 又。 对 于 采用 标号 编写 的 汇编 程序 ， 
编译 程序 必须 进行 两 次 转换 。 这 就 意味 着 编译 程序 需要 通读 程序 两 次 ， 每 次 阅读 都 是 按 从 上 至 下 的 顺 
序 进行 。 在 第 一 次 通读 时 ， 编 译 程序 会 建立 一 组 称 为 符号 表 (symbol table) 的 对 应 关系 。 例 如 ， 在 上 
面 的 例子 中 ， 编 译 程序 就 建立 了 一 个 包含 三 个 符号 (X、Y 和 2Z) 的 对 应 表 。 因 为 当 编 译 程序 从 上 至 下 
阅读 程序 代码 时 ， 不 可 能 一 次 就 将 全 部 的 汇编 语言 指令 转换 成 机 器 代码 。 原 因 是 对 于 只 使 用 标号 的 指 
令 ， 编 译 程序 还 不 知道 指令 的 数据 部 分 存放 在 存储 器 中 的 具体 位 置 。 但 是 ， 在 符号 表 建 立 之 后 ， 编 译 
程序 可 以 进行 第 二 次 通读 ， 并 且 会 “填充 原来 的 空白 位 置 ”。 

在 上 述 例子 中 ， 编 译 程序 的 第 一 次 通读 生成 一 个 以 下 的 符号 表 : 








同时 ， 编 译 程序 也 开始 翻译 程序 指令 。 在 进行 第 一 次 通读 后 ， 翻 译 出 来 的 指令 并 不 完整 ， 如 下 表 
所 示 : 





在 第 二 次 通读 时 ， 编 译 程序 使 用 符号 表 来 填充 空白 地 址 ， 并 且 生 成 相应 的 机 器 语言 指令 。 这 样 ， 
在 第 二 次 通读 时 ， 编 译 程序 就 知道 了 X 是 位 于 地 址 104 的 存储 单元 ， 并 且 会 使 用 104 来 替代 标记 符号 
X。 同 样 ， 也 使 用 类 似 的 过 程 来 蔡 代 和 2 ， 结 果 如 下 : 
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因为 大 多 数 的 人 都 不 喜欢 读 十 六 进 制 数 ， 所 以 大 多 数 汇编 语言 允许 指定 存储 在 存储 器 中 的 数据 值 
是 二 进 制 数 ， 十 六 进 制 数 ， 或 十 进 制 数 。 通常 ， 编 译 程序 会 使 用 某 种 类 型 的 汇编 指令 (assembler di- 
rective) 来 专门 指定 解释 这 些 数值 所 采用 的 基数 。 汇 编 指 令 是 一 种 专门 为 编译 程序 设计 的 指令 ， 它 本 
身 是 不 会 被 翻译 成 机 器 代码 的 。 在 MARIE 汇编 语言 中 我 们 用 DEC 表示 十 进 制 数 ，HEX 表示 十 六 进 
制 数 。 例 如 ， 可 以 使 用 汇编 指令 的 方法 重 编写 表 4-4 中 的 程序 ， 结 果 如 表 4-5 所 示 。 

如 果 并 不 希望 阅读 实际 的 二 进 制 的 数据 值 (书写 形式 为 十 六 表 4-5 使 用 汇编 指令 的 常数 表示 法 
进 制 数 ) ， 可 以 使 用 汇编 指令 DEC 来 指定 一 个 十 进 制 的 数值 。 编 ， 
译 程序 能 够 识别 该 汇编 指令 ， 并 且 会 在 数据 存放 到 存储 器 之 前 转 
换 成 相应 的 二 进 制 数值 。 另 外 ， 该 汇编 指令 不 会 被 转换 成 机 器 语 
言 ， 只 是 指示 编译 程序 的 某 种 工作 方式 。 

另外 注释 分 隔 符 〈comment delimiter) 是 一 种 几乎 对 每 一 种 编程 
语言 都 通用 的 汇编 指令 。 它 是 一 些 特殊 的 字符 ， 用 来 告诉 编译 程序 
(或 编译 器 ) 进行 编译 转换 时 ， 忽 略 跟 随 在 这 个 特殊 符号 后 面 的 所 有 
文本 内 容 。MARIE 的 注释 分 隔 符 是 一 个 前 斜 枉 “/” 符 号 ， 其 作用 
是 忽略 位 于 这 个 分 隔 符 和 该 行 的 行 末 之 间 的 所 有 文本 内 容 。 


4.5.2 为 什么 使 用 汇编 语言 


介绍 MARIE 的 汇编 语言 的 主要 目的 是 为 了 使 读者 了 解 这 种 语言 和 计算 机 体系 结构 之 间 的 相互 关 
系 。 了 解 了 怎样 利用 汇编 语言 编程 就 可 以 很 好 地 理解 计算 机 的 体系 结构 ， 反 之 亦 然 。 学 习 汇编 语言 不 
但 可 以 了 解 计算 机 的 基本 体系 结构 ， 而 且 可 以 真正 认识 处 理 器 的 工作 方式 并 深刻 理解 所 编程 的 特定 的 
计算 机 系统 的 具体 内 部 构造 。 学 习 汇 编 语 言 编 程 还 会 有 其 他 方面 的 一 些 益处 。 

大 多 数 的 程序 员 都 认为 通常 一 个 程序 中 10% 的 代码 可 能 会 占用 90% 的 CPU 时 间 。 对 于 一 些 时 间 
因素 非常 关键 的 应 用 ， 常 常 需要 对 这 部 分 10% 的 代码 进行 优化 处 理 。 一 般 情况 下 ， 编 译 程序 可 以 处 理 
这 种 优化 过 程 。 它 首先 处 理 高 级 语言 (如 C++ 语言 )， 将 其 转换 成 汇编 语言 ， 然 后 再 转换 成 机 器 代码 。 
编译 程序 的 应 用 已 经 有 一 段 相当 长 的 时 间 ， 而 且 在 大 多 数 情况 下 能 够 高 效 工 作 。 但 是 ， 在 某 些 情况 下 ， 
程序 员 需 要 避 开 高 级 语言 的 某 些 限制 ， 而 必须 直接 使 用 汇编 代码 。 通 过 这 种 方法 ， 程 序 员 可 以 使 程序 
在 时 间 和 空间 上 都 具有 更 高 效率 。 通 常 ， 利 用 混合 编程 的 方法 ， 即 一 个 程序 的 大 部 分 内 容 使 用 高 级 语 
言 ， 但 某 些 部 分 直接 使 用 汇编 语言 ， 可 以 让 程序 员 充 分 发 挥 这 两 种 语言 的 各 自 优势 。 

现在 的 问题 是 ， 在 何 种 情况 下 ， 程 序 应 该 采用 汇编 语言 来 编写 ? 如 果 一 个 程序 的 大 小 或 响应 时 间 
是 程序 设计 考虑 的 关键 因素 ， 汇 编 语言 通常 是 编程 的 首选 。 这 是 因为 编译 程序 会 速 蔽 掉 有 关 各 种 操作 
的 耗 时 信息 。 这 样 ， 程 序 员 常常 很 难 判断 由 编译 程序 编译 的 程序 的 实际 运行 过 程 。 而 汇编 语言 可 以 让 
程序 员 更 贴近 机 器 的 体系 结构 ， 且 更 准确 地 控制 程序 的 执行 。 如 果 程序 员 需 要 实现 某 些 高 级 语言 所 没 
有 的 操作 ， 那 么 使 用 汇编 语言 是 必 不 可 少 的 。 

如 果 考 虑 响应 特性 和 空间 〈 即 程序 大 小 ) 的 作为 程序 设计 关键 因素 ， 则 可 以 在 嵌入 式 系统 (em- 
bedded system) 中 找到 一 个 理想 的 例证 。 在 实际 应 用 的 嵌入 式 系统 中 ， 计 算 机 通常 被 集成 为 某 个 系统 
中 的 二 个 部 件 ， 而 条 是 纯粹 的 计算 机 。 岩 入 式 系 统 的 应 用 非常 广泛 ， 经 常 时 间 约 束 〈time constrained) 
的 环境 下 使 用 。 这 些 嵌 入 式 系统 常常 被 设计 为 只 能 执行 某 个 单一 指令 或 是 执行 某 种 非常 专用 的 指令 系 
统 。 也 许 我 们 每 天 都 在 使 用 某 种 类 型 的 嵌入 式 系统 。 例 如 ， 消 费 者 使 用 的 电子 产品 〈 如 照相 机 、 摄 录 
机 、 移 动 电话 、PDA 和 交互 游戏 设备 等 ) ， 家 用 电器 (如 洗 碗 机 、 微 波 炉 和 洗衣 机 等 )， 汽 车 特别 是 
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其 中 的 发 动机 控制 和 防 抱 死 刹 车 系统 )， 医 疗 仪器 (如 CAT 扫描 仪 和 心脏 监视 器 等 )， 以 及 工业 设备 
(如 生产 过 程 的 控制 设备 和 航空 设备 ) 等 ， 这 些 都 只 是 艇 人 式 系统 应 用 的 一 少 部 分 例子 。 

对 于 一 个 手 入 式 系 统 ， 软 件 是 非常 关键 的 。 软 件 需要 在 某 些 非常 特殊 的 响应 参量 之 中 操作 运行 ， 
并 且 它 所 能 够 占用 的 空间 是 非常 有 限 的 。 因 此 ， 在 嵌 人 式 系统 中 使 用 汇编 语言 编程 是 非常 合适 的 。 


4.6 MARIE 指令 集 的 扩充 


尽管 利用 MARIE 的 指令 集 足 以 编写 任何 所 需 的 程序 ， 但 可 以 再 增加 几 条 指令 使 MARIE 的 编程 
任务 变 得 更 加 简单 。MARIE 的 指令 代码 使 用 了 4 位 二 进 制 数 ， 这 意味 着 共 可 以 生成 16 条 指令 ， 而 我 
们 只 使 用 了 其 中 的 9 条 指令 。 表 4-6 列 出 了 扩充 MARIE 的 指令 集 所 增加 的 指令 。 
表 4-6 MARIE 的 扩充 指令 集 











指令 编号 可 
(十 六 进 制 ) 指令 意义 
0 JnS xX 将 PC 内 容 存 储 到 地 址 X 处 ， 然 后 跳 转 到 地 址 X 十 1。 
A Clear AC 中 的 所 有 位 清 0。 
B AddI X 间接 相 加 ;进入 地 址 XX 处 ,使 用 XX 单元 的 数值 作为 数据 操作 数 的 实际 地 址 ， 取 出 操 
作 数 加 到 累加 器 AC 中 。 
C JumpI X 间接 转移 ， 进 人 地 址 X 处 ， 使 用 X 单 元 的 数值 作为 存储 单元 的 实际 地 址 ， 然 后 跳 转 
至 该 存储 单元 。 





Jns 〈 跳 转 - 和 -存储 ) 指令 可 以 对 某 个 返回 指令 存储 一 个 地 址 指针 ， 然 后 继续 处 理 ， 对 不 同 的 指令 
设置 新 的 PC 值 。 利 用 这 条 指令 可 以 进行 过 程 调用 和 其 他 子 程序 的 调用 ， 而 当 子 程序 执行 完成 后 系统 
又 会 返回 到 原 程 序 代 码 中 的 调用 点 。clear 指令 会 将 累加 器 的 全 部 二 进 制 位 设置 为 0。 利 用 这 条 指令 
可 以 缩短 指令 周期 ， 理 则 完成 相同 的 清 零 操作 需要 从 存储 器 中 装 人 0 操作 数 而 花费 更 多 的 时 间 。 

AddI 指令 (还 有 JumpI 指令 ) 采用 的 是 不 同 的 寻 址 方式 (addressing mode) 。 前 面 介绍 的 所 有 指 
令 都 假定 了 指令 数据 部 分 的 数值 就 是 指令 所 需要 的 操作 数 的 直接 地 址 (direct address)。 而 AddI 指令 
则 是 采用 间接 寻 址 方式 (indirect addressing mode)。 第 5 章 将 讨论 更 多 种 类 的 寻 址 方式 。 在 这 里 ， 
CPU 不 是 采用 地 址 X 的 值 作为 操作 数 的 实际 地 址 ， 而 是 使 用 地 址 X 的 存储 器 单元 内 的 数据 值 作为 一 
个 指针 ， 指 向 一 个 新 的 存储 器 单元 。 这 个 新 单元 内 的 数值 才 是 指令 要 使 用 的 数据 。 例 如 ， 已 知 指令 为 
AddI 400。 具 体 执 行 过 程 是 首先 到 达 地 址 400 的 存储 单元 ， 并 假定 读 出 存储 单元 400 中 的 值 是 240， 
然后 CPU 转向 地 址 为 240 的 单元 以 获取 指令 所 需 的 实际 操作 数 。 从 本 质 上 来 说 ,我 们 已 经 在 程序 诺言 
中 使 用 了 多 个 地 址 指针 。 

如 果 采 用 寄存 器 传输 表示 法 ， 这 些 新 的 指令 可 以 表示 如 下 形式 ， 

JnS 

MBR ¢ PC 
MAR < X 
MIMAR] 人 MBR 
MBR ¢— X 

RC 人 1 

AC 人 AC+MBR 
pC ee AC 
Clear 

ACE 0 
AddliX 

MAR < X 

MBR 《- MIMAR] 

MAR ¢— MBR 

MBR ¢— MIMAR] 
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AC € AC+MBR 
JumpI X 

MAR ¢€~- X 

MBR ¢- MI[MAR] 
PC 《- MBR 


表 4-7 概括 了 MARIE 的 全 部 指令 集 。 





0000 


0001 


0010 


0011 


0100 


0101 


0110 


0111 


1000 


1001 


1010 


1011 


1100 


Output 


Skipcond 


AddI X 


JumpI X 


表 4-7 MARIE 的 完整 指令 集 


MBR €— PC 

MAR 和 一 X 
MI[MAR] 《一 一 MBR 
MBR 《一 X 

RC 入 

AC €— AC+MBR 
PO 二 一 CC 


MAR <— X 


MBR €— MI[MAR], AC < MBR 


MAR 《一 X, MBR €— AC 


M[MAR] < 一 MBR 
MAR < 一 X 

MBR <€— MI[MAR] 
AC < 和 一 AC+MBR 
MRR < 一 X 

MBR <— MIMAR] 
RC< AC-MBR 
AC €— InREG 


OutREG 和 一 AC 


IE IR[11-10]=00 then 

If AC 《0 then PC<e 一 PC+1 
Else If IR[11-10]=01 then 

If AC=0 then PC €— PC+1 
Else If IR[11-10]=10 then 

Tf BMG. 3 0 Then. PC <— PO*Y 


EE ELLe0] 


AC'E== 0 


MAR<—— X 

MBR €— MI[MAR] 
MAR €— MBR 
MBR <€— MI[MAR] 
AC <— AC+NMBR 


MAR<— X 
MBR €— MI[MAR] 
PC €—— MBR 


下 面 来 看 看 使 用 完整 指令 集 的 一 些 示 例 。 
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例 4- 
Addr 


Loop, 


Addr ， 
Next ， 
Num, 
Sum, 
Ctr, 
One, 


1 


ess 
100 
101 
102 
103 
104 
105 


106 
107 
108 
109 
10A 
10B 
10C 
10D 
10E 
10F 
110 
111 
112 
113 
114 
115 
116 
117 
118 
119 
11A 
11B 
11C 


使 用 一 个 循环 过 程 来 编写 5 个 数字 相 加 的 汇编 程序 。 


Instruction Comments 


Load 
Store 
Load 
Subt 
Store 
Clear 


Load 
AddI 
Store 
Load 
Add 


Store 
Load 
Subt 
Store 
Skipcond 
Jump 
Halt 
Hex 
Hex 
Dec 
Dec 
Hex 
Dec 
Dec 
Dec 
Dec 
Dec 
Dec 


Addr /Load address of first number to be added 

Next /Store this address as our Next pointer 

Num /Load the number of items to be added 

One /Decrement 

Ctr /Store this value in Ctr to control looping 
/Clear AC 


Sum /Load the Sum into AC 
Next /Add the value pointed to by location Next 
Sum /Store this Sum 
Next /Load Next 
One /Increment by one to point to next address 
Next /Store in our pointer Next 
Ctr /Load the loop control variable 
One /Subtract one from the loop control variable 
Ctr /Store this new value in the loop control variable 
000 /If control variable < 0, skip next instruction 
Loop /Otherwise, go to Loop 
/Terminate program 
118 /Numbers to be summed start at location 118 
0 /A pointer to the next number to add 
5 /The number of values to add 
0 
0 


/The sum 
/The loop control variable 
1 /Used to increment and decrement by 1 
10 /The values to be added together 
15 
20 
25 
30 


编程 中 使 用 了 注释 来 对 各 条 程序 语句 进行 合理 的 解释 。 现 在 ， 我们 还 要 针对 例 4-1 做 一 些 讨论 。 
读者 可 以 回顾 一 下 符号 表 存 储 有 关 [标号 、 存 储 单元 ] 对 的 情形 。 指 令 Load Addr 现在 变 成 了 Load 
112， 因 为 Addr 被 定 为 物理 存储 器 中 地 址 112。 然 后 将 存放 在 Addr 的 数值 118 存放 到 Next 处 。Next 
是 一 个 地 址 指针 ， 人 允许 把 要 进行 相 加 的 5 个 数值 〈 分 别 位 于 地 址 118、119、11A、11B 和 11C 的 单元 
内 )“ 逐 次 装 人 ”。 变 量 ctr 跟踪 记录 程序 所 执行 的 循环 迭代 的 次 数 。 每 次 循环 都 从 Ctr 减 去 1, 然后 
检查 ctr 是 否 为 负 值 。 如 果 ctr 为 负 值 ， 则 终止 循环 。 然 后 将 求 和 值 Sum (初始 值 设 为 0 ) 装 人 AC 
中 。 循 环 开始 后 ， 使 用 Next 作为 要 加 到 ac 中 的 各 个 数据 的 地 址 。 当 ctr 为 负 值 时 ，skipcond 语句 
就 会 终止 循环 ， 即 跳 过 接 下 来 的 一 条 无 条 件 跳 转 到 循环 体 项 部 的 指令 。CPU 执行 到 Halt 指令 时 ， 整 


个 程序 的 运行 就 终止 了 。 


例 4-2 则 表示 怎样 利用 Skipcond 指令 和 Jump 指令 来 实现 不 同 的 选择 。 虽 然 本 程序 展示 的 是 一 个 
if/else 结构 ， 但 是 读者 也 可 以 方便 地 对 程序 进行 修改 ， 使 其 能 够 实现 一 个 if/then 结构 ， 或 者 
case (或 switch) 结构 的 功能 。 


例 4-2 下 面 的 程序 举例 说 明了 如 何 使 用 一 个 if / else 结构 来 实现 多 种 选择 。 具 体 说 ， 程 序 执行 
了 如 下 的 操作 : 
if X ”YY then 
XI-XX 2 
elgse 
Y :一 YY 一 区 
Address Instruction Comments 
If, 100 Load xX /Load the first value 
101 Subt Y /Subtract value of Y and store result in AC 
102 Skipcond 400 /If AC = 0, skip the next instruction 
103 Jump Else /Jump to the Else part if AC is not equal to 0 
Then, 104 Load .4 /Reload X so it can be doubled 
105 Add xX /Double X 
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106 Store x /Store the new value 
107 “Jump Endif /Skip over Else part to end of If 
Else, 108 Load Y /Start the Else part by loading Y 
109 Subt x /Subtract X from Y 
10A Store Y /Store 了 Y 一 Xin 了 
Endif, 10B Halt /Terminate program (it doesn't do much!) 
X, 10C Dec 12 /Assume these values for X and Y. 
Y, 10D Dec 20 国 


例 4-3 说 明了 怎样 利用 Jns 和 JumpI 指令 来 实现 子 程序 的 调用 。 程 序 包括 一 条 END 语句 ， 这 是 汇 
编 指令 的 另 一 个 例子 。 这 条 语句 通知 编译 程序 应 该 在 哪里 停止 程序 。 其 他 一 些 可 能 的 汇编 指令 包括 下 
面 一 些 语句 ， 如 让 编译 程序 知道 到 哪里 去 寻找 第 一 条 程序 指令 ， 如 何 设置 存储 器 单元 ， 以 及 各 个 代码 
模块 是 否 属于 程序 过 程 等 。 

例 4-3 下 面 的 程序 举例 说 明了 如 何 利用 一 个 简单 的 子 程序 对 任意 数字 进行 加 倍 操作 ， 并 且 可 以 对 
子 程序 进行 编码 。 注 意 ， 程 序 行 的 编号 仅 用 于 信息 标示 。 


100 Load X /Load the first number to be doubled 
101 Store Temp /Use Temp as a parameter to pass value to Subr 
102 Jns Subr /Store return address, jump to procedure 
103 Store X /Store first number, doubled 
104 Load YY /Load the second number to be doubled 
105 Store Temp /Use Temp as a parameter to pass value to Subr 
106 JnS Subr /Store return address, jump to procedure 
107 Store 了 /Store second number, doubled 
108 Halt /End program 
XX, 109 Dec 20 
Y, 10A Dec 48 
Temp, 10B Dec 0 
Subr, 10C Hex 0 /Store return address here 
10D Clear /Clear AC as it was modified by JnS 


10E Load Temp /Actual subroutine to double numbers 
10F Add Temp /AC now holds double the value of Temp 
110 JumpI Subr /Return to calling code 
END 图 
利用 MARIE 的 简单 指令 集 可 以 实现 任何 高 级 编程 语言 的 结构 功能 ， 例 如 loop 语句 和 while 庄 
名 。 这 些 内 容 将 在 本 章 结尾 留 给 读者 作为 练习 。 


4.7 有 关 译 码 的 讨论 : 硬件 译 码 和 微 程 序 控制 译 码 


控制 单元 实际 上 是 如 何 工作 的 呢 ? 前 面 我 们 已 经 实施 了 一 些 人 为 的 控制 过 程 ， 并 且 简 单 地 假设 每 
个 事件 都 会 按照 我 们 所 描述 的 方式 进行 。 对 这 种 做 法 的 基本 理解 是 , 对 于 每 条 指令 ， 控 制 单元 都 能 够 
”控制 CPU 按 正确 的 步骤 执行 操作 。 事 实 上 ，CPU 中 必须 有 一 些 控制 信号 连 线 施 加 到 各 个 数字 部 件 ， 
才 使 CPU 可 以 按照 上 述 的 方式 正确 工作 〈 读 者 可 以 回顾 第 3 章 描述 的 各 个 数字 部 件 )。 例 如 ， 在 MA- 
RIE 使 用 汇编 语言 执行 add 指令 时 ， 实 际 上 就 已 经 假设 了 加 法 运算 可 以 发 生 。 因 为 控制 信号 将 ALU 
设置 为 加 法 运算 ， 并 将 结果 存放 到 AC 中 。ALU 具有 不 同 的 控制 线 ， 可 以 决定 执行 哪 一 种 操作 。 现 在 
要 解决 的 问题 是 ， 这 些 控制 线 实际 上 是 怎样 被 选中 有 效 ? 

可 以 采用 两 种 方法 来 正确 设置 各 条 控制 线 。 第 一 种 方法 是 从 物理 上 将 各 条 控制 线 与 实际 的 机 器 指 
令 连接 起 来 。 一 般 来 说 ， 指 令 被 划分 成 不 同 的 域 。 指 令 中 不 同 的 位 通过 各 种 数字 逻辑 部 件 组 合 连 接 在 
一 起 ， 用 来 驱动 不 同 的 控制 线 。 这 种 方法 称 为 硬 连 线 控制 (hardwired control) ， 如 图 4-14 所 示 。 

利用 硬件 可 以 实现 控制 单元 ， 例 如 采用 一 些 简单 的 与 非 门 、 触 发 器 和 计数 器 等 。 可 以 使 用 一 些 特 
殊 的 数字 电路 来 作为 控制 单元 的 输入 ， 例 如 连接 来 自 指令 操作 码 域 的 代码 位 ， 来 自 标志 (或 状态 ) 寄 
存 器 的 标志 位 ， 来 自 总 线 的 信号 以 及 来 自 时 钟 的 信号 等 。 当 然 ， 控 制 单元 还 要 产生 一 些 输出 的 控制 信 
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来 自 系 统 总 线 的 
输入 (如 中 断 ) 


来 自 时 钟 的 输入 


来 自 状 态 / 标志 
寄存 器 的 输入 





人 
控制 信号 连接 到 各 寄存 
器 、 总 线 和 ALU) 


图 4-14 硬件 控制 单元 示意 图 
号 用 来 驱动 计算 机 中 的 各 个 部 件 。 例 如 ， 可 以 使 用 4-16 译 码 器 来 对 操作 码 进 行 译 码 。 利 用 指令 寄存 器 
CR) 中 的 内 容 和 ALU 的 状态 ， 控制 单 元 可 以 控制 各 个 寄存 器 操作 、ALU 的 操作 、 所 有 的 移 位 电路 
和 总 线 访问 等 。 

硬 连 线 控制 的 优点 是 速度 快 。 缺 点 是 指令 集 和 控制 逻辑 通过 特殊 的 电路 直接 连接 ， 使 得 电路 变 得 
比较 复杂 ， 设 计 或 修改 都 比较 困难 。 如 果 一 台 计 算 机 系统 是 由 硬 连 线 控制 的 ， 那 么 要 进行 指令 集 的 扩 
充 ( 正 如 在 MARIE 机 器 中 所 做 的 一 样 ) ， 就 必须 改变 计算 机 内 部 的 物理 部 件 。 这 样 ， 费 用 会 出 奇 地 昂 
贵 。 原 因 是 不 但 需要 建造 新 的 功能 芯片 ， 而 且 原 有 芯片 也 需要 重新 定位 和 放置 。 

另外 一 种 控制 方法 是 微 编程 〈(microprogramiming) ， 即 使 用 软件 来 进行 控制 ， 如 图 4-15 所 示 。 

这 里 ， 所 有 的 机 器 指令 都 被 放置 到 一 个 专用 的 程序 〈( 微 程序 (miocroprogram)) 中 ， 然 后 将 这 些 
指令 转换 成 规定 的 控制 信号 。 微 程序 其 实 是 一 个 用 微 代 码 (microcode) 编写 的 翻译 器 ， 这 些微 程序 被 
存储 在 计算 机 固件 (如 ROM、PROM 或 EPROM 等 ) 中 ， 称 为 控制 存储 器 (control store) 。 这 个 微 程 
序 将 由 0 和 1 组 成 的 机 器 指令 转换 成 各 种 控制 信号 。 从 本 质 上 来 说 ， 这 个 微 程序 中 的 每 条 机 器 指令 都 
有 一 个 子 程序 。 这 种 方法 的 优点 是 如 果 指 令 集 需要 修改 ， 只 需要 简单 地 更 新 微 程序 ， 而 实际 的 硬件 部 
分 不 需要 做 任何 改变 。 

微 编程 在 设计 方面 非常 灵活 简单 ， 而 且 有 助 于 设计 功能 强大 的 指令 集 。 微 编程 方法 可 以 非常 方便 
地 让 设计 人 员 在 硬件 和 软件 之 间作 出 权衡 .如 果 设 计 上 有 些 内 容 不 能 用 硬件 来 实现 (例如 ， 机 器 上 没 
有 乘法 语句 )， 则 可 以 使 用 微 代码 来 实现 。 这 种 方法 的 缺点 是 所 有 指令 都 需要 经 过 一 次 额外 的 翻译 过 
程 ， 这 样 会 减 慢 整 个 程序 的 执行 速度 。 除 了 时 间 上 的 代价 外 ， 还 有 实际 开发 成 本 问题 ， 因 为 微 编程 还 
需要 一 些 专门 的 工具 。 第 9 章 将 详细 讨论 有 关 硬 连 线 控制 和 微 编程 控制 的 问题 。 

非常 重要 的 一 点 是 ， 无 论 使 用 硬 连 线 控制 还 是 使 用 微 编 程控 制 ， 关 键 问题 在 于 同步 和 定时 。 控 
制 单元 负责 发 送 实际 的 定时 信号 ， 来 指挥 所 有 的 数据 传送 和 协调 计算 机 的 各 种 动作 。 这 些 定时 信和 号 
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来 自 状态 / 标志 时 钟 
寄存 器 的 输入 


将 微 指令 放 入 缓冲 区 内 


执行 给 定 微 指令 
的 子 程序 


控制 信号 
图 4-15 ” 微 程 序 控 制 方法 


可 以 使 用 一 个 简单 的 二 进 制 计 数 器 按 顺序 产生 。 例 如 ， 某 个 计算 机 体系 结构 的 定时 信号 可 能 包含 
Ti1、Ts、T3、T4、Ts 、Tis Tr 和 Ts 几 个 时 钟 周期 。 这 些 时 钟 定 时 信号 将 控制 计算 机 中 各 种 操作 
动作 的 发 生 。 例 如 ， 取 指 操 作 可 能 只 是 发 生 在 Ti 周期 ， 而 提取 操作 数 的 操作 可 能 只 是 发 生 在 T4 周 
期 。 前 面 我 们 已 经 知道 寄存 器 只 有 当时 钟 脉 冲 到 来 时 ， 才 可 能 改变 其 状态 。 同 样 ， 这 些 状态 的 改变 
需要 与 特定 的 定时 信号 相关 联 。 例 如 ， 第 3 章 中 的 存储 器 就 含有 一 条 写 允 许 (Write Enable) 的 控制 
线 。 这 条 控制 线 和 一 个 定时 信号 线 一 起 构成 “与 ”操作 ， 以 保证 存储 器 的 存储 单元 只 能 在 规定 的 时 
间 间 隔 内 发 生 改变 。 


4.8 实际 的 计算 机 体系 结构 


本 章 介绍 的 MARIE 体系 结构 是 非常 简单 的 ， 其 目的 是 为 了 便于 读者 理解 有 关 计算 机 体系 结构 的 
基本 概念 ， 这 样 不 会 让 读者 觉得 计算 机 是 一 个 深 不 可 测 的 复杂 系统 。 虽 然 MARIE 体系 结构 和 汇编 语 
言 功 能 十 分 强大 ， 足 以 解决 利用 各 种 高 级 语言 (如 C++、Ada、 或 Java 语言 ) 在 现代 计算 机 体系 结构 
上 实现 的 所 有 问题 。 但 是 ， 读 者 会 发 现 MARIE 体系 结构 在 工作 效率 ， 编写 程序 的 复杂 性 和 程序 调试 
等 方面 都 存在 局 限 性 。 例 如 ， 如 果 在 MARIE 的 CPU 中 多 增加 一 些 寄存 器 ， 以 提高 存储 能 力 ， 那 么 
MARIE 的 性 能 就 可 以 获得 重大 改进 。 而 对 于 程序 员 来 说 ， 使 得 编程 变 得 更 加 容易 是 MARIE 体系 结构 
中 另 一 项 需要 改进 的 工作 3 例如 $ MARIE 程序 员 就 非常 希望 使 用 一 些 带 有 参量 的 过 程 子 程序 。 虽 然 


、 
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MARIE 可 以 执行 某 些 子 程序 ， 例 如 ， 程 序 可 以 进行 分 支 转移 ， 可 以 跳 转 到 不 同 的 代码 段 去 执行 分 支 任 
务 ， 然 后 返回 等 。 但 是 ，MARIE 还 没有 一 种 机 制 来 支持 子 程序 中 的 参量 传递 过 程 。 尽 管 可 以 不 使 用 参 
量 来 编写 程序 ， 但 是 很 明显 ， 参 量 的 使 用 不 仅 可 以 提高 程序 的 工作 效率 (特别 是 涉及 重用 的 地 方 );， 而 
用 使 程序 更 易于 编写 和 调试 。 

为 了 增加 参量 内 容 ，MARIE 需要 一 个 堆栈 (stack) 结构 。 堆 栈 是 一 种 数据 结构 类 型 ， 它 可 以 保 
持 一 系列 的 数据 项 ， 这 些 项 只 能 从 堆栈 的 某 一 端 来 访问 。 一 个 堆栈 类 似 于 放 在 橱柜 中 的 一 从 盘子 : 正 
常情 况 下 ， 只 能 往 盘 子 堆 的 上 面 逐一 堆放 盘子 ， 也 只 能 从 盘子 堆 的 顶部 逐次 取 走 盘子 。 因 为 这 个 理由 ， 
堆栈 常常 被 称 为 后 进 先 出 〈last-in-first-out) 的 结构 。 在 本 书 结尾 部 分 ， 附 录 A 给 出 了 各 种 不 同 数据 结 
构 的 简要 介绍 。 

如 果 我 们 对 数据 访问 方式 加 以 限制 ， 可 以 利用 主 存储 器 中 的 某 些 存储 单元 来 模仿 一 个 堆栈 结构 。 
例如 ， 假 定 把 从 0000 到 00FF 的 存储 器 单元 用 作 一 个 堆栈 ， 将 0000 单元 当 作 堆栈 项。 将 数据 加 入 ( 简 
称 压 入 ，pushing) 堆栈 必 须 从 堆栈 顶部 开始 ， 而 将 数据 移出 (简称 弹出 ，popping) 堆栈 也 必须 从 堆栈 
顶部 开始 。 例 如 ， 如 果 要 把 数值 2 讨 人 人 堆栈， 数值 2 将 首先 会 被 放 到 0000 单元 。 如 果 要 继续 压 人 数值 
6， 则 数字 2 会 被 放 到 0001 单元 ， 而 将 数值 6 放 和 人 0000 单元 。 如 果 热 行 堆栈 弹出 操作 ， 则 数值 6 会 首 
先 被 移出 。 计 算 机 使 用 一 个 堆栈 指针 〈stack pointer) 来 跟踪 记录 应 该 被 压 人 或 弹出 项 的 存放 位 置 。 

MARIE 具备 现代 计算 机 体系 结构 的 许多 特性 。 但 是 ， 由 于 MARIE 过 于 简单 ， 还 不 能 对 现代 计算 
机 系统 的 这 些 特性 进行 非常 精确 的 描述 。 在 接 下 来 的 两 节 内 容 中 ， 我 们 将 介绍 两 种 现代 的 计算 机 体系 
结构 ， 以 便 更 好 地 阐明 现代 计算 机 体系 结构 的 各 种 特性 。 当 然 ， 这 里 不 再 讨论 按照 Leonardo da Vinci 
思想 设计 的 简单 的 MARIE。 首 先 要 介绍 Intel 体系 结构 (包括 x86 系列 和 奔腾 系列 CPU) ， 然 后 再 讨 
论 MIPS 体系 结构 。 之 所 以 选择 介绍 这 两 种 体系 结构 ， 是 因为 尽管 它们 在 某 些 方面 有 相似 之 处 。 但 是 ， 
从 本 质 上 来 说 ， 这 两 种 体系 结构 是 建立 在 不 同 的 设计 思想 的 基础 上 的 。Intel 体系 结构 中 的 x86 系列 
CPU 被 称 为 CISC (复杂 指令 集 计算 机 ，Complex Instruction Set Computer)， 而 Intel 的 奔腾 系列 CPU 
和 MIPS 体系 结构 则 是 RISC (精简 指令 集 计 算 机 ，Reduced Instruction Set Computer) 的 范例 。 

CISC 机 器 具有 数目 庞大 、 长 度 各 异 和 设计 复杂 的 指令 系统 。 其 中 大 多 数 指令 非常 复杂 ， 单 一 指令 
的 执行 常常 需要 多 个 操作 才能 完成 。 例 如 ， 这 些 操作 可 能 是 由 单一 (single) 汇编 语言 指令 构成 循环 结 
构 。CISC 机 器 所 遇 到 的 基本 问题 是 ， 这 些 复杂 的 CISC 指令 的 一 个 小 的 子 集 就 可 能 显著 减 慢 CPU 的 运 
行 速度 。 于 是 ， 设 计 人 员 们 又 决定 重新 采用 不 那么 复杂 的 体系 结构 ， 并 且 对 一 些小 的 但 是 完整 的 指令 
集 实 行 硬 连 线 ， 使 指令 执行 的 速度 变 得 非常 快 。 这 就 是 说 ， 计 算 机 是 利用 编译 器 来 为 指令 系统 (1SA) 
生成 有 效 代码 。 采 用 这 种 设计 思想 的 机 器 称 为 RISC 机 器 。 

RISC 在 某 种 程度 上 是 用 词 不 当 。RISC 结构 的 指令 的 数目 的 确 是 减少 了 。 但 是 ，RISC 机 器 的 主要 
目的 是 简化 指令 ， 使 指令 的 执行 速度 更 快 。 在 RISC 系统 中 ， 每 条 指令 只 执行 一 个 操作 ， 所 有 指令 的 
长 度 相同 ， 只 是 格式 上 有 少许 差别 。 并 且 ， 所 有 的 算术 运算 都 在 寄存 器 之 间 执 行 ， 存 储 器 中 的 数据 不 
能 用 作 操 作 数 。 自 从 1982 年 以 来 ， 所 有 新 设计 的 指令 系统 基本 上 都 属于 RISC 结构 ， 或 者 是 CISC 和 
RISC 的 某 种 组 合 。 第 9 章 将 详细 讨论 CISC 和 RISC。 


4. 8. 1 Intel 体系 结构 


Intel 公司 生产 了 多 种 不 同体 系 结构 的 CPU 产品 ， 可 能 读者 比较 熟悉 其 中 的 某 些 体系 结构 。Intel 
公司 第 一 个 非常 流行 的 芯片 是 8086 芯片 ， 于 1979 年 推出 ， 并 且 成 功 地 应 用 在 IBM PC 计算 机 上 。 
8086 可 以 处 理 16 位 数据 ，20 位 地 址 ， 并 且 可 以 寻 址 1M 字 节 的 内 存 。8086 还 有 一 个 近亲 产品 ，8 位 
的 8088 芯片 ， 应 用 在 许多 PC 机 上 可 以 降低 成 本 。8086 CPU 从 功能 上 分 为 两 部 分 : 执行 单元 (execu- 
tion unit) ， 包 含 通用 寄存 器 和 ALU; 以 及 总 线 接 口 单元 (bus interface unit)， 包含 指令 队列 、 段 寄存 
器 和 指令 指针 。 

8086 配 有 4 个 16 位 的 通用 寄存 器 ， 分 别称 为 AX (累加 器 )、BX (用 于 扩展 寻 址 的 基 址 寄存 
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器 )、CX (计数 寄存 器 ) 和 DX (数据 寄存 器 ) 。 这 些 寄存 器 中 的 每 一 个 都 被 分 成 两 个 区 域 : 左边 的 8 
位 被 指定 为 高 位 字 节 ， 分 别 用 AH、BH、CH 和 DH 表示 ; 而 右边 的 8 位 被 指定 为 低位 字 节 ， 分 别 
用 AL、BL、CL 和 DL 表 示 。 各 种 8086 的 指令 都 使 用 一 个 专用 的 寄存 器 ， 即 指令 寄存 器 。 这 个 指令 
寄存 器 也 可 以 作为 其 他 用 途 。8086 有 3 个 指针 寄存 器 : 堆栈 指针 〈SP) ， 用 来 存放 指示 堆栈 地 址 的 
偏 移 量 ; 基 址 指针 〈BP) ， 用 作 压 人 堆栈 的 参考 地 址 参量 ;以 及 指令 指针 〈IP)， 用 于 保持 下 一 条 指 
令 的 地 址 ， 类 似 于 MARIE 中 程序 计数 器 PC。8086 还 有 2 个 变 址 寄存 器 : SI ( 源 变 址 ) 寄存 器 ， 用 
在 串 操 作 时 的 源 地 址 指针 ; DI 〈 目 的 变 址 ) 寄存 器 ， 用 作 串 操作 的 目的 地 址 指针 。8086 还 配置 了 一 
个 状态 标志 寄存 器 (status flags register) ， 其 中 的 不 同位 分 别 指示 各 种 状态 条 件 ， 如 溢出 、 奇 偶 校 
验 、 进 位 和 中 断 等 。 

8086 的 汇编 语言 程序 可 以 分 成 不 同 的 段 (segment)， 即 一 些 特殊 的 程序 块 或 区 域 ， 用 来 保留 某 些 
特定 的 信息 类 型 。 其 中 包括 : 代码 段 (存放 程序 )、 数 据 段 (存放 程序 中 的 数据 ) 和 堆栈 段 (存放 程 序 
中 的 堆栈 )。 如 果 要 访问 任意 段 内 的 信息 ， 需 要 指定 相对 于 该 段 段 首 的 地 址 偏 移 量 。 因 此 ， 需 要 段 指针 
来 存放 这 些 段 地 址 。 这 些 寄存 器 包括 代码 段 (CS) 寄存 器 、 数 据 段 (DS) 寄存 器 和 堆栈 段 (SS) 寄存 
器 。8086 还 带 有 第 4 个 段 寄存 器 ， 称 为 附加 段 (ES) 寄存 器 ， 用 于 某 些 串 操作 时 的 存储 器 寻 址 。 存 储 
器 地 址 是 采用 段 地 址 /地 址 偏 移 量 的 寻 址 方式 给 出 ， 具 体形 式 为 : zzz: yyy。 其 中 ，zzz 是 段 寄存 器 
中 的 数值 ， 而 yyy 是 地 址 偏 移 量 。 

1980 年 ，Intel 公司 推出 了 8087。8087 在 8086 的 机 器 指令 集 基 础 上 增加 了 浮 点 指令 ， 以 及 采用 一 
个 80 位 宽度 的 堆栈 。 在 随后 的 时 间 里 ，Intel 公司 又 发 布 了 许多 新 的 芯片 。 但 是 从 本 质 上 来 说 ， 这 些 
新 的 芯片 与 8086 芯片 具有 相同 的 指令 系统 (ISA) 。 这 些 芯片 包括 : 1982 年 推出 的 80286 (可 以 寻 址 
16MB 字 节 ) 和 1985 年 推出 的 .80386 〈 寻 址 多 达 4GB 字 节 ) 。80386 是 一 个 32 位 芯片 ， 也 是 8086 系列 
中 的 第 一 个 32 位 芯片 ， 通 常 被 称 作 IA-32 (Intel 体系 结构 的 32 位 CU)。 在 Intel 公司 从 16 位 的 
80286 进步 到 32 位 的 80386 时 ， 设 计 人 员 需 要 考虑 这 些 结构 能 够 向 下 兼容 (backward compatible) ， 即 
在 老式 的 功能 较 差 的 处 理 器 上 编写 的 程序 可 以 在 新 型 的 较 快 的 处 理 器 上 运行 。 例 如 ， 在 80286 上 运行 
的 程序 同样 也 可 以 在 80386 上 运行 。 所 以 ，Intel 在 不 断 改进 中 还 保留 了 相同 的 基本 体系 结构 和 寄存 器 
组 。 由 于 在 后 续 的 产品 中 增加 了 许多 新 的 特性 ， 所 以 并 不 能 保证 系列 芯片 可 以 向 前 兼容 。 

依据 命名 惯例 ，80386 芯片 在 寄存 器 从 16 位 变 为 32 位 后 ， 对 寄存 器 组 的 命名 增加 了 一 个 前 缀 
“E” (E 代表 “扩展 ”)。 这 样 ， 原 来 的 16 位 寄存 器 AX、 


O16 位 一 < 一 8 位 一 < 一 8 位 一 


BX、CX 和 DX， 现在 分 别 被 命名 为 EAX、EBX、ECX 和 ; 
EDX。 这 种 命名 惯例 同样 适用 于 其 他 的 寄存 器 组 。 但是， he 
对 于 程序 员 来 说 ,仍然 可 以 使 用 原来 的 名 称 ， 例 如 AX、 Re 
AL 和 AH 等 ， 来 访问 原来 的 寄存 器 。 图 4-16 给 出 了 这 种 
工作 方式 的 示意 图 ， 以 AX 寄存 器 为 例 。 32 位 

80386 和 80486 都 是 .32 位 计算 机 ， 具 有 32 位 数据 总 图 4.16 EAX 寄存 器 ， 划 分 成 不 同 的 区 域 
线 。80486 增加 了 一 个 高 速 缓冲 存储 器 (cache)， 这 大 大 提 
高 了 CPU 的 性 能 ( 详 见 第 6 章 有 关 高 速 缓存 和 存储 器 的 讨论 )。 

Intel 公司 从 奔腾 (Pentium) CPU (Intel 公司 之 所 以 改变 命名 方法 ， 从 数字 80486 变 为 Pentium 
是 因为 数字 不 能 用 作 注 册 商 标 ) 开始 推出 的 奔腾 系列 处 理 器 。 奔 腾 处 理 器 具有 32 位 寄存 器 、64 位 数 
据 总 线 ， 并 采用 了 超标 量 (superscalar) 设计 。 这 就 是 说 ， 超 标量 的 CPU 可 以 有 多 个 ALU， 每 个 时 钟 
周期 可 以 执行 多 条 机 器 指令 ， 即 多 条 指令 可 以 并 行 执行 。Pentium Pro CPU 增加 了 分 支 预 测 功 能 ， 而 
Pentium II 又 增加 了 MMX 技术 来 处 理 多 媒体 事件 ， 尽 管 大 多 数 人 都 认为 这 种 技术 算 不 上 是 一 个 巨大 
成 功 。Pentium JI 则 采用 浮 点 指令 ， 增 加 了 对 3D 图 形 处 理 的 进一步 支持 。 从 历史 上 来 说 ，Intel 处 理 
器 采用 的 都 是 传统 的 CISC 方法 。 直 到 最 近 ，Pentium II 和 Pentium III 的 设计 开始 采用 一 种 组 合 方法 ， 
即 运 用 具有 RISC 内 核 的 CISC 体系 结构 。 这 种 结构 可 以 将 CISC 指令 转换 成 RISC 指令 。Intel 公司 也 
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在 顺应 计算 机 的 发 展 趋势 , 将 CPU 的 设计 从 CISC 思想 转 到 RISC 设计 理念 。 

Intel 公司 推出 的 第 7 代 处 理 器 系列 是 Intel 的 奔腾 4 (P4) 处 理 器 。P4 处 理 器 和 Intel 以 前 的 处 理 
器 有 很 多 方面 的 不 同 ， 其 中 的 许多 内 容 超出 了 本 书 的 范围 。 下 面 简单 介绍 几 点 : P4 CPU 的 时 钟 频率 
为 1. 4GHz (或 者 更 高 )， 芯 片 使 用 了 超过 4200 万 个 上 晶体管， 并 且 实 现 了 称 为 并 发 〈netburst) 的 微 体 
系 结构 (microarchitecture) 。 在 此 之 前 ，Pentium 系列 的 处 理 器 都 是 基于 相同 的 微 体系 结构 设计 的 ， 这 
里 使 用 微 体 系 结构 来 描述 指令 集 下 面 的 体系 结构 。P4 处 理 器 的 这 种 新 的 微 结构 由 下 面 几 个 创新 技术 所 
组 成 : 超 流 水 线 (hyper-pipeline) (有 关 流 水 线 的 内 容 将 在 第 5 章 讨论 ), 一 个 400MHz (或 更 快 的 ) 
系统 总 线 ， 还 有 多 项 有 关 高 速 缓存 和 浮 点 操作 的 改进 技术 。 这 些 技术 使 P4 处 理 器 在 多 媒体 信息 的 应 用 
方面 的 效果 非常 好 。 

2001 年 Intel 公司 发 布 的 安 腾 (ltanium) 处 理 器 标志 着 Intel 的 第 一 个 64 位 芯片 (IA-64) 的 诞 
生 。Itanium 处 理 器 包含 基于 寄存 器 的 编程 语言 和 非常 丰富 的 指令 集 。Itanium 处 理 器 还 使 用 硬件 仿真 
器 来 保持 Itanium 与 IA-32/x86 系列 的 指令 集 的 向 下 兼容 性 。Itanium 处 理 器 有 4 个 整数 处 理 单元 ，2 
个 浮 点 运算 单元 。Itanium 的 高 速 缓存 容量 也 有 了 大 幅度 提高 ， 并 且 将 高 速 缓存 划分 为 4 个 不 同 的 级 
别 。 本 书 在 第 6 章 中 将 详细 介绍 有 关 高 速 缓存 的 内 容 。Itanium 处 理 器 配备 128 位 的 浮 点 寄存 器 和 128 
位 的 整数 寄存 器 ， 还 有 其 他 一 些 寄 存 器 用 于 处 理 分 支 情况 下 指令 的 有 效 载 人 。Itanium 处 理 器 至 多 可 以 
编 址 16GB 的 主 存储 器 。 

体系 结构 的 汇编 语言 实际 上 反映 了 有 关 体 系 结构 的 许多 重要 信息 。 为 了 对 MARIE 的 体系 结构 与 
Intel 的 体系 结构 进行 比较 ,我 们 可 以 再 回 到 例 4-1 中 的 MARIE 程序 ， 即 使 用 一 个 循环 程序 实现 5 个 
数字 的 相 加 。 现 在 ， 使 用 x86 系列 处 理 器 的 汇编 语言 来 对 例 4-1 中 的 程序 重 写 ， 如 例 4-4 所 示 。 这 里 要 
特别 注意 的 是 ， 整 个 程序 由 一 个 Data 段 指令 和 一 个 Code 段 指令 组 成 。 

例 4-4 在 Pentium 机 器 上 运行 的 程序 示例 ， 该 例 是 使 用 一 个 循环 结构 来 执行 5 个 数值 加 法 运算 。 


DATA 
Numi EQU 10 ; Numl is initialized to 10 
EQU 15 ; Each word following Numl is initialized 
EQU 20 
EQU 25 
EQU 30 
Num DB 5 : Initialize the loop counter 
Sum DB 0 ; Initialize the Sum 
CODE 
LEA EBX, Numl ; Load the address of Numl into EBX 
MOV ECX, Num ; Set the loop counter 
MOV EAX, 0 ; Initialize the sum 
MOV EDI, 0 ; Initialize the offset (of which number to add) 
Start: ADD EAX, [EBX+EDI *4] : Add the EBXth number to EAX 
INC EDI ; Increment the offset by 1 
DEC ECX ; Decrement the loop counter by 1 
JG Start ; If counter is greater than 0, return to Start 
MOV Sum, EAX ; Store the result in Sum 


闻 样 也 可 以 使 用 一 个 1oop 语句 使 得 上 面 的 程序 更 易于 阅读 〈 但 是 这 样 做 也 使 程序 看 起 来 不 太 像 
”MARIE 的 汇编 语言 程序 ) 。 从 句法 上 来 说 ， 循 环 指令 类 似 于 跳 转 指令 ， 其 中 需要 一 个 标号 。 将 上 述 程 
序 中 的 循环 过 程 重 写 如 下 : 


MOV ECX, Num ; Set the counter 
Start: ADD EAX, [EBX + EDI + 4] 
INC EDI 
LOOP Start 
MOV Sum, EAX 丁 


x86 系列 处 理 器 的 汇编 语言 中 的 循环 语句 类 似 于 C 语言 、C++ 语 言 和 Java 语言 中 的 do ... while 
语句 结构 。 所 不 同 的 是 , 这 种 汇编 语言 中 的 循环 语句 并 没有 显 式 的 循环 变量 ,而 是 采用 ECX 寄存 器 来 
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保持 循环 的 计数 值 。 每 执行 一 次 循环 指令 ， 处 理 器 就 将 ECX 的 数值 减 1。 然 后 CPU 会 测试 ECX 的 内 
容 ， 检 查 ECX 中 的 数值 是 否 等 于 0。 如 果 ECX 中 的 数值 不 等 于 0， 就 会 控制 程序 跳 转 到 Start 处 ， 再 
次 执行 循环 操作 。 如 果 ECX 中 的 数值 等 于 0， 则 终止 循环 。 循 环 语句 是 一 种 可 以 使 程序 员 的 编程 变 得 
更 为 方便 的 指令 类 型 的 例子 ， 但 是 这 类 指令 并 不 是 计算 机 操作 所 必需 的 指令 。 


4.8.2 MIPS 体系 结构 


MIPS 系列 CPU 是 目前 最 成 功 和 设计 类 型 最 灵活 的 CPU 之 一 。MIPS R3000、R4000、R5000、 
R8000 和 R10000 就 是 其 中 一 些 属于 MIPS 科技 公司 的 注册 商标 。 除 了 应 用 于 计算 机 系统 (例如 ，Sili- 
con 图 形 计算 机 系统 ) 外 ，MIPS 芯片 还 广泛 应 用 于 嵌入 式 系统 和 计算 机 控制 的 玩具 中 (例如 ， 任 天 堂 
和 索尼 公司 在 它们 的 许多 电子 游戏 产品 中 都 使 用 MIPS 的 CPU) 。 另 外 ， 思 科 公 司 是 一 个 非常 成 功 的 因 
特 网 路 由 器 制造 商 ， 同 样 在 它们 的 产品 中 使 用 MIPS 的 CPU。 

第 一 代 MIPS 指令 系统 体系 结构 (ISA) 是 MIPS I。 接 下 来 是 MIPS I， 然 后 发 展 到 MIPS V。 当 
前 的 MIPS 的 ISA 体系 结构 称 为 MIPS 32 (针对 32 位 体系 结构 ) 和 MIPS 64 (针对 64 位 体系 结构 ) 。 
这 部 分 内 容 主要 讨论 MIPS 32 结构 。 值 得 注意 的 是 ，MIPS 技术 也 有 Intel 技术 类 似 的 特点 ， 这 就 是 在 
ISA 不 断 发 展 的 变化 过 程 中 ， 始 终 保持 体系 结构 的 向 下 兼容 性 。 与 Intel 系列 产品 一 样 ， 每 种 新 ISA 版 
本 的 MISP 产品 都 会 对 包括 操作 性 能 和 指令 系统 在 内 的 诸多 方面 做 出 有 效 改进 ， 并 且 能 够 有 效 地 处 理 
浮 点 数值 。 新 型 的 MIPS 32 和 MIPS 64 结构 的 CPU 在 VLSI 技术 和 CPU 组 成 方面 都 有 了 重大 进步 。 
相对 于 传统 的 体系 结构 来 说 ， 这 些 进步 在 提高 CPU 的 性 能 和 降低 制造 成 本 上 带 来 了 非常 显著 的 好 处 。 

就 像 Intel 的 IA-32 和 IA-64 一 样 ，MIPS 的 ISA 体系 结构 具有 丰富 的 内 置 指令 系统 ， 包 括 算术 运 
算 指令 、 逻 辑 运 算 指令 、 比 较 运算 指令 、 数 据 转移 指令 、 分 支 指令 、 跳 转 指令 、 移 位 指令 和 多 媒体 指 
今 等 。MIPS 是 一 种 装载 /存储 体系 结构 (load/store architecture)， 这 就 是 说 所 有 的 指令 〈 不 仅仅 是 装 
人 和 存储 指令 ) 都 必须 使 用 寄存 器 作为 指令 的 操作 数 ， 不 允许 使 用 存储 器 作为 指令 的 操作 数 。MIPS 
结构 有 168 条 32 位 的 指令 ， 但 是 许多 指令 的 功能 都 很 类 似 。 例 如 ，MIPS 有 6 条 不 同 的 加 法 指令 。 这 
6 条 加 法 指令 都 是 执行 数值 相 加 的 运算 ， 其 区 别 只 是 所 使 用 的 操作 数 和 寄存 器 各 不 相同 。 在 汇编 语言 
的 指令 系统 中 ， 同 一 个 操作 具有 多 条 指令 的 设计 思想 是 非常 普遍 的 。 另 外 一 条 通用 的 指令 是 MIPS 中 
的 NOP (no-op) 指令 。NOP 指令 并 不 执行 任何 实际 的 操作 ， 只 是 消耗 时 间 而 已 。 在 第 5 章 中 ， 读 者 
将 会 看 到 NOP 指令 应 用 于 在 流水 线 操作 的 情形 。 

采用 MIPS 32 体系 结构 的 CPU 具有 32 个 32 位 的 通用 寄存 器 ， 编 号 从 r0 到 r31。 其 中 的 两 个 寄存 
器 有 着 特殊 用 途 : r0 通过 硬 连 线 连接 到 一 个 数值 0， 而 r31 是 专门 用 作 某 些 特定 指令 的 默认 寄存 器 。 
也 就 是 说 ， 这 些 指 令 本 身 并 不 需要 专门 指定 r32 这 个 寄存 器 。 在 MIPS 的 汇编 语言 中 ， 这 32 个 通用 寄 
存 器 分 别 被 指定 为 $0、$1、… 和 和 $31。 寄存器 1 保留 使 用 ， 寄 存 器 26 和 27 用 于 操作 系统 的 内 核 。 
寄存 器 28、29 和 30 为 指针 寄存 器 。 剩 下 的 寄存 器 可 以 通过 编号 来 加 以 引用 ， 这 些 寄 存 器 的 命名 惯例 
如 表 4-8 所 示 。 例 如 ， 可 以 使 用 编号 $8 或 $t0 来 引用 寄存 器 8。 


表 4-8 MIPS 32 寄存 器 命名 惯例 
寄存 器 存放 的 数值 


Sv0-Sv1 Results, expressions 


$a0-$a3 Arguments 


St0-St7 Temporary Values 


Saved Values 





St8-St9 More temporary values 


MIPS 32 还 有 两 个 专用 寄存 器 ，HI 和 LO， 用 来 保存 某 些 整数 运算 的 结果 。 当 然 ，MIPS 也 有 一 
个 PC (程序 计数 器 ) 寄存 器 ， 总 共有 3 个 专用 寄存 器 。 
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MIPS 32 有 32 个 32 位 的 浮 点 寄存 器 ， 用 于 单 精度 浮 点 运算 。 而 双 精 度 浮 点 数值 则 按照 划分 奇 - 偶 
数 对 的 方式 存储 这 些 寄 存 器 中 。 还 有 供 浮 点 单元 使 用 4 个 专用 的 浮 点 控制 寄存 器 。 
下 面 ， 我 们 使 用 MIPS 的 汇编 语言 再 来 重新 编写 例 4-1 中 的 程序 。 这样 ， 读 者 可 以 对 这 些 不 同 的 
体系 结构 进行 比较 。 
例 4.5 
,data 
# St0 = sum 


# Stl = loop counter Ctr 
Value: .word 10, 15,20,25,30 


Sum = 0 

Ctr 一 5 

.text 

.8&lobal main # declaration of main as a global variable 
main: lw $t0, Sum # Initialize register containing sum to zero 

lw $t1l, Ctr # Copy Ctr value to register 

la $t2, value # $t2 is a pointer to current value 
while: blez $tl, end while # Done with loop if counter 《= 0 

lw $t3, 0($t2) # Load value offset of 0 from pointer 

add St0，St0，St3  # Add value to sum 

addi $t2, $t2, 4 # Go to next data value 

sub $ti, $tl, 1 # Decrement Ctr 

b while # Return to top of loop 

la $t4, sum # Load the address of sum into register 

sw St0，0(St4) # Write the sum into memory location sum 


这 种 程序 类 似 于 Intel 中 使 用 的 程序 代码 。 循 环 计数 器 的 数值 被 复制 到 一 个 寄存 器 中 ， 每 次 循环 
迭代 寄存 器 中 的 数值 自动 减 1。 同 时 ，CPU 会 检查 寄存 器 中 的 数值 是 否 小 于 或 等 于 0。 在 MIPS 体系 
结构 中 ， 寄 存 器 的 命名 看 起 来 有 些 复杂 。 但 是 ， 如 果 理 解 了 这 种 命名 惯例 ， 实 际 上 使 用 起 来 也 很 
方便 。 

如 果 读 者 对 编写 MIPS 的 程序 有 兴趣 ， 但 又 苦于 找 不 到 一 台 MIPS 机 器 的 话 ， 可 以 使 用 某 些 MIPS 
仿真 器 。 现 在 最 流行 的 MIPS 仿真 器 是 SPIM， 它 是 一 种 功能 完备 的 仿真 器 ， 可 以 运行 MIPS R2000/ 
R3000 的 汇编 语言 程序 。SPIM 还 提供 了 一 个 简单 的 程序 调试 器 ， 并 且 几 乎 可 以 执行 MIPS 汇编 指令 集 
中 的 全 部 指令 。SPIM 的 程序 包 包含 源 代 码 和 一 整套 的 管理 文件 。 这 个 程序 包 可 以 运行 于 Unix (包括 
Linux)、Windows (PC) 、Windows (DOS) 和 Macintosh 系统 。 如 果 读 者 要 了 解 进一步 的 信息 ， 可 以 
参阅 本 章 结尾 处 的 参考 文献 。 

如 果 仔 细 研 究 例 4-1、 例 4-4 和 例 4-5， 不 难 发 现 这 些 程序 中 的 指令 非常 相似 。 除 了 调用 寄存 器 的 
方式 不 同和 命名 不 同 外 ， 其 中 包括 的 各 种 操作 基本 上 是 相同 的 。 有 些 汇编 程序 语言 具有 比较 大 的 指令 
集 ， 较 大 的 指令 集 可 以 使 程序 员 在 对 不 同 的 算法 进行 编码 的 过 程 中 有 更 多 的 选择 。 但 是 ， 正 如 我 们 在 
MARIE 例子 中 所 见 到 的 ， 一 个 大 的 指令 集 并 不 是 完成 计算 机 的 各 种 操作 所 必需 的 。 


本 章 小 结 


本 章 阑 述 了 一 个 简单 的 计算 机 体系 结构 MARIE。 学 习 简 单 的 MARIE， 非 常 有 助 于 理解 计算 机 的 取 指 - 
译 码 -执行 周期 和 计算 机 的 实际 工作 原理 。 这 个 简单 的 体系 结构 具备 一 套 自 己 指令 系统 〈ISA) 和 汇编 语言 。 
本 书 详细 介绍 了 指令 集 和 汇编 语言 两 者 之 间 的 相互 关系 ， 并 且 可 以 利用 这 些 指令 集 和 汇编 语言 为 MARIE 
编写 各 种 应 用 程序 。 

CPU 是 各 种 计算 机 的 主要 核心 部 件 。CPU 由 数据 通路 和 控制 单元 组 成 。 数 据 通 路 包括 若干 个 寄存 器 和 
一 个 由 总 线 连接 起 来 的 ALU。 控 制 单元 负责 对 各 种 操作 和 数据 的 移动 进行 排序 ， 并 产生 相应 的 定时 信号 。 
计算 机 中 的 所 有 部 件 都 要 利用 定时 信号 来 实现 同步 工作 。 而 输入 /输出 子 系统 则 负责 为 计算 机 获取 各 种 数据 
信息 或 将 数据 返回 用 户 。 
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MARIE 是 一 个 专门 设计 的 非常 简单 的 计算 机 体系 结构 。 利 用 MARIE 模型 可 以 清晰 地 阐明 本 章 中 引信 
的 各 种 基本 概念 ， 而 义 不 会 陷入 太 多 的 技术 细节 中 。MARIE 机 器 采用 16 位 的 指令 ， 并 有 4K 的 16 位 字 的 
主 存储 器 和 7 个 寄存 器 。 其 中 ， 只 有 一 个 通用 寄存 器 ， 即 累加 器 AC。MARIE 的 指令 使 用 其 中 的 4 位 作为 
操作 码 ， 而 剩 下 的 其 他 12 位 则 表示 地 址 。 本 章 还 引入 了 寄存 器 传输 表示 法 作为 一 种 符号 表示 方法 ， 可 以 在 
寄存 器 层次 上 检查 每 条 指令 所 执行 的 具体 操作 细节 。 

计算 机 运行 程序 所 遵从 的 基本 步骤 是 ， 取 指 - 译 码 -执行 的 循环 过 程 。 首 先 要 进行 提取 指令 的 操作 ， 然 
后 对 指令 译 码 ， 提 取 指 令 所 需要 的 各 种 操作 数 ， 最 后 执行 指令 。 中 断 需 要 在 这 种 循环 过 程 的 开始 处 进行 处 
理 ， 中 断 处 理 完毕 后 ， 计 算 机 会 返回 正常 的 取 指 - 译 码 -执行 周期 。 

机 器 语言 由 一 系列 二 进 制 数字 组 成 ， 这 些 二 进 制 数字 所 代表 的 就 是 可 执行 的 各 种 机 器 指令 。 而 汇编 语 
言 使 用 助 记 符 号 指令 ， 这 些 助 记 符 号 指令 代表 的 是 对 应 的 机 器 语言 程序 中 的 数字 数据 。 汇编 语言 是 一 种 编 
程 语言 ， 但 是 它 并 不 能 为 程序 员 提 供 大 量 的 数据 类 型 或 指令 。 汇 编 语 言 程序 所 代表 的 是 一 种 低级 (面向 机 
器 ) 的 编程 方法 。 

从 某 种 意义 上 来 说 ， 利 用 MARIE 的 汇编 语言 进行 编程 是 件 非 常 乏味 的 事情 。 不 难看 出 ， 大 多 数 的 分 
支 程 序 结构 都 必须 由 程序 员 利 用 跳 转 语句 和 分 支 转 移 语句 来 显 式 地 进行 程序 实现 。 从 汇编 语言 到 高 级 语言 
(如 C+ 十 语言 或 Ada 语言 还 有 相当 大 的 一 段 距 离 。 因 此 ， 编 译 程序 (编译 器 ) 就 成 为 一 个 很 好 的 中 间 步 
又 ， 利 用 编译 程序 可 以 将 源 代码 转换 成 一 些 机 器 能 够 识别 和 理解 的 指令 。 这 里 的 重点 不 是 介绍 汇编 语言 ， 
本 书 的 目的 也 不 是 为 了 让 读者 可 以 很 快 掌握 汇编 语言 ， 并 成 为 汇编 语言 的 程序 员 。 相 反 ， 这 里 引入 汇编 指 
令 是 为 了 帮助 读者 更 好 地 理解 计算 机 的 体系 结构 ， 以 及 指令 系统 和 体系 结构 之 闻 的 相互 关系 。 汇 编 语言 的 
知识 也 有 助 于 理解 各 种 高 级 语言 (如 C 十 十 、Java 或 Ada 等 语言 ) 程序 的 执行 过 程 中 ， 在 机 器 层 上 所 发 生 
的 各 种 具体 操作 过 程 。 编 写 x86 系列 和 MIPS 系列 体系 结构 的 汇编 语言 程序 要 比 编写 MARIE 汇编 语言 
序 容 易 一 些 。 但 是 ， 相 对 于 高 级 语言 来 说 ， 编 写 和 调试 汇编 语言 程序 还 是 要 困难 得 多 。 

本 章 介绍 了 Intel 和 MIPS 的 汇编 语言 和 体系 结构 ， 但 没有 涉及 任何 过 程 的 细节 。 引 人 这 两 种 体系 结构 
有 如 下 的 两 点 理由 : 第 一 ， 对 不 同 的 体系 结构 进行 比较 分 析 是 一 件 令 人 感 兴趣 的 事情 ， 也 是 学 习 计 算 机 组 
成 和 体系 结构 非常 必要 的 。 我 们 先 从 非常 简单 的 体系 结构 出 发 ， 进 而 介绍 一 些 更 加 复杂 和 菊 手 的 体系 结构 。 
通过 比较 研究 ， 可 以 更 加 清晰 地 了 解 这 些 体系 结构 之 间 的 异同 。 第 二 ， 虽然 从 形式 上 看 起 来 ，Intel 和 
MIPS 的 汇编 语言 与 MARIE 的 汇编 语言 有 很 大 不 同 ， 但 是 在 实际 的 功能 上 它们 却 是 完全 等 效 的 。 它 们 都 包 
含 一 些 访问 存储 器 和 寄存 器 的 指令 ， 移 动 数据 的 指令 ， 执 行 算术 运算 和 逻辑 运算 的 指令 ， 以 及 一 些 分 支 转 
移 指令 。MARIE 的 指令 集 非常 简单 ， 而 且 缺 少许 多 Intel 和 MIPS 指令 集中 的 所 谓 “编程 用 户 友 好 ”的 指 
令 。Intel 和 MIPS 的 体系 结构 还 比 MARIE 结构 拥有 更 多 的 寄存 器 。 除 了 在 指令 的 数目 和 寄存 器 的 数目 方 
面 存在 着 较 大 的 差别 外 ， 这 三 种 体系 结构 的 语言 功能 几乎 是 完全 一 样 的 。 
深入 阅读 
在 本 教材 的 主页 可 以 下 载 一 个 MARIE 的 汇编 语言 仿真 器 。 利 用 仿真 器 可 以 编译 和 运行 MARIE 的 
程序 。 、 

有 关 CPU 组 成 原理 和 指令 系统 体系 结构 的 细节 资料 可 以 参阅 Tanenbaum (1999) 和 Stallings (2000) 
的 著作 。 而 Mano (1991) 的 著作 中 包含 大 量 有 关 微 编程 体系 结构 的 示例 。Wilkes (1958) 的 文章 也 是 一 篇 
很 好 的 有 关 微 编程 的 参考 资料 。 

关于 Intel 汇编 语言 编程 的 更 多 资料 可 以 查阅 Abel (2001) 、Dandamudi (1998) 和 Jones (1997) 的 书 
籍 。Jones 的 著作 所 采用 的 是 一 种 直接 和 简单 的 方法 介绍 汇编 语言 编程 。 这 三 本 书籍 的 介绍 都 十 分 详尽 和 深 
人 和信。 如 果 读 者 对 其 他 汇编 语言 感 兴趣 的 话 ， 可 以 参考 Struble (1975): IBM 汇编 语言 ，Gill、Corwin 和 
Logar (1987) :Motorola 汇编 语言 ， 和 Sun Microsysytems (1992) ，SPARC 汇编 语言 。 而 要 了 解 嵌 入 式 系 
统 的 汇编 语言 可 以 尝试 阅读 Williams (2000) 的 书籍 。 

如 果 想 了 解 有 关 MIPS 汇编 语言 编程 的 内 容 ，Patterson 和 Hennessy (1997) 的 著作 是 一 本 很 好 的 参考 
书 ， 并 且 书 中 备 有 单独 的 附录 ， 提 供 了 许多 有 价值 的 信息 。Donovan (1972) 的 著作 同样 也 很 好 地 介绍 了 
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MIPS 的 编程 环境 。 而 Kane 和 Heinrich (1992) 的 著作 无 疑 是 一 本 有 关 MIPS 计算 机 的 指令 系统 和 汇编 语 
言 程序 的 经 典 教科 书 。 读 者 也 可 在 MIPS 公司 的 主页 找到 大 量 的 有 用 信息 。 

要 了 解 更 多 有 关 Intel 体系 结构 的 内 容 ， 请 参考 Alpert 和 Avnon (1993)，Brey (2003)， 以 及 Dulon 
(1998) 的 书籍 和 文章 。Shanley (1998) 的 著作 可 能 是 有 关 Pentium 体系 结构 的 最 好 的 书籍 之 一 。 而 有 关 
Motorola 体系 结构 、Ultrasparc 体系 结构 和 Alpha 体系 结构 ， 分 别 在 Circello (1995)、Horel 和 Lauterbach 
《1999)， 以 及 McLellan (1995〉 的 文章 中 有 相关 的 讨论 。 对 于 高 级 的 计算 机 体系 结构 ， 一 般 性 的 介绍 可 以 
参阅 Tabak (1991) 的 著作 。 

要 学 习 更 多 有 关 MIPS 体系 结构 的 SPIM 仿真 器 的 知识 ， 可 参考 Patterson 和 Hennessy (1997) 的 著 
作 ， 或 直接 浏览 SPIM 的 主页 。Waldron 〈1999) 的 书籍 是 一 本 很 好 的 有 关 RISC 汇编 语言 编程 和 MIPS 的 
导论 。 
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基本 概念 和 术语 复习 


DD ~ can mei 一 


.CPU 的 主要 功能 是 什么 ? 

.数据 通路 的 作用 是 什么 ? 

. 控制 单元 的 任务 是 什么 ? 

， 寄存 器 安置 在 什么 位 置 ? 有 何 种 不 同类 型 的 寄存 器 ? 

， ALU 怎样 知道 要 执行 哪 一 种 功能 ? 

.为 什么 总 线 通常 是 计算 机 内 部 通信 的 瓶颈 ? 

. 点 对 点 的 总 线 和 多 点 总 线 之 间 有 何 区 别 ? 

. 为 什么 总 线 协议 非常 重要 ? 

. 解释 数据 总 线 、 地 址 总 线 和 控制 总 线 之 间 的 差别 。 

. 什么 是 总 线 周期 ? 

. 举 出 三 种 不 间 类 型 的 总 线 ， 并 指出 这 些 总 线 在 计算 机 中 的 位 置 。 
.同步 总 线 和 异步 总 线 之 间 有 什么 区 别 ? 

. 总 线 仲裁 的 4 种 方式 是 什么 ? 

.解释 时 钟 周 期 和 时 钟 频率 之 间 的 区 别 。 

.如 何 区 别 系 统 时 钟 和 总 线 时 钟 ? 

. I/O 接口 的 主要 功能 是 什么 ? 

. 解释 存储 器 映射 的 IO 和 基于 指令 的 /QO 之 间 的 区 别 。 

. 一 个 字 节 和 一 个 字 有 何不 同 ? 如何 区 分 它们 ? 

. 解释 按 字 节 编 址 和 按 字 编 址 的 区 别 。 

. 为 什么 地 址 的 对 齐 非常 重要 ? 

. 列 出 并 解释 两 种 不 同类 型 的 存储 器 交互 存储 方式 ， 并 说 明 它 们 之 间 的 差别 。 
. 解释 中 断 的 工作 原理 ， 并 列举 4 种 不 同类 型 的 中 断 方式 。 

. 可 屏蔽 中 断 和 不 可 屏蔽 中 断 之 间 有 何不 同 ? 

.如 果 MARIE 有 4K 字 的 主 存储 器 ， 为 什么 地 址 需要 有 12 位 ? 
. 说 明 MARIE 的 所 有 寄存 器 的 功能 。 

.什么 是 操作 码 ? 

. 阐述 MARIE 的 每 条 指令 的 工作 方式 。 

. 机 器 语言 和 汇编 语言 有 何 区 别 ? 它们 之 间 是 否 存在 一 一 对 应 的 转换 关系 〈 一 条 汇编 语言 指令 等 于 一 条 


机 器 语言 指令 )? 


. RTN 有 什么 重要 性 ? 

:一 个 微 操作 与 一 条 机 器 指令 是 否 是 同一 回 事 ? 
. 微 操作 与 常规 的 汇编 语言 指令 有 何 区 别 ? 
32. 说 明 取 指 - 译 码 -执行 周期 的 各 个 步骤 。 
.中断 驱动 的 WO 是 如 何 工作 的 ? 





34. 


35. 
36. 
37. 
38， 
39. 
40. 
41. 
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解释 编译 程序 的 工作 原理 ， 包 括 怎样 产生 符号 表 ， 对 源 代 码 和 目的 代码 所 执行 的 操作 ， 以 及 怎样 处 理 
标号 。 

什么 是 嵌入 式 系统 ? 它 与 常规 的 计算 机 系统 有 何 区 别 ? 

跟踪 描述 例 4-1 中 程序 的 细节 执行 过 程 〈 类 似 于 图 4-13) 。 

解释 硬 连 线 控制 和 微 编程 控制 的 区 别 。 

什么 是 堆栈 ? 堆栈 对 于 编程 有 什么 重要 性 ? 

比较 CISC 机 器 和 RISC 机 器 的 异同 。 

Intel 体系 结构 和 MIPS 体系 结构 有 什么 区 别 ? 

分 别 列举 4 种 Intel 处 理 器 和 MIPS 处 理 器 。 


练习 题 


1. 
2. 


$3. 


CPU 的 主要 功能 是 什么 ? 

阐述 CPU 对 中 断 的 响应 过 程 ， 包 括 CPU 检测 中 断 的 方法 ， 如 何 处 理 中 断 和 中 断 服务 完成 后 CPU 的 
反应 。 

如 果 对 一 个 2MX 32 的 存储 器 按 下 列 方式 进行 编 址 ， 需 要 多 少 位 地 址 ? 


令 a) 存储 器 按 字 节 编 址 ? 
令 b) 存储 器 按 字 编 址 ? 


4 


S6. 


如 果 对 一 个 4MX 16 的 主 存 储 器 (内存) 按 下 列 方式 进行 编 址 ， 需 要 多 少 位 地 址 ? 
a) 主 存储 器 按 字 节 编 址 ? 
b) 主 存储 器 按 字 编 址 ? 


.如 果 对 一 个 1MX8 的 主 存储 器 〈 内 存 ) 按 下 列 方式 进行 编 址 ， 需 要 多 少 位 地 址 ? 


a) 主 存储 器 按 字 节 编 址 ? 
b) 主 存储 器 按 字 编 址 ? 
如 果 采 用 256KBX8 的 RAM 芯片 来 构建 一 个 2 MX16 的 主 存储 器 ， 并 且 存 储 器 按 字 编 址 。 


令 a) 共 需 要 多 少 RAM 芯片 ? 

令 b) 每 个 字 需 要 多 少 RAM 芯片 ? 

令 c) 每 个 RAM 芯片 需要 多 少 个 地 址 位 ? 

令 d) 这 个 存储 器 有 多 少 组 ? 

仿 e) 所 有 的 存储 器 需要 多 少 地 址 位 ? 

令 f) 如 果 使 用 高 位 交互 存储 方式 ， 地 址 14 (十 六 进 制 数 E) 的 存储 单元 位 于 什么 位 置 ? 
令 g) 对 于 低位 交互 存储 方式 ， 重 做 练习 f) 。 


7. 
8. 


9 ， 


假设 利用 512KX8 的 RAM 芯片 构建 一 个 16 MX 16 的 存储 器 ， 重 做 练习 6。 

一 个 数字 计算 机 的 存储 单元 的 每 个 字 有 24 位 。 指 令 集 由 150 个 不 同 的 操作 组 成 。 所 有 的 指令 都 有 一 个 操 
作 代码 部 分 〈 操 作 码 ) 和 一 个 地 址 部 分 〈 只 涉及 一 个 地 址 ) 。 每 条 指令 都 存储 于 一 个 存储 器 字 中 。 请 问 : 
a) 操作 码 需要 多 少 位 ? 

b) 指令 的 地 址 部 分 还 留 下 多 少 位 ? 

c) 允许 的 最 大 存储 器 容量 是 多 少 ? 

d) 在 一 个 存储 器 字 中 可 能 的 最 大 的 无 符号 二 进 制 数 是 多 少 ? 

假设 有 一 个 2” 字 节 的 存储 器 : 


令 a) 如 果 存 储 器 按 字 节 编 址 ， 那 么 最 低 和 最 高 的 地 址 分 别 是 多 少 ? 
多 b) 如 果 采 用 一 个 16 位 字 和 按 字 编 址 ， 那 么 最 低 和 最 高 的 地 址 分 别 是 多 少 ? 


10. 


c) 如 果 采 用 一 个 32 位 字 和 按 字 编 址 ， 那 么 最 低 和 最 高 的 地 址 分 别 是 多 少 ? 
已 知 一 个 2048 字 节 的 存储 器 ， 由 几 个 64X8 RAM 的 芯片 组 成 。 并 且 假 定 存储 器 是 按 字 节 编 址 的 。 请 
问 : 下 列 7 个 图 中 哪个 图 指示 的 是 使 用 地 址 位 的 正确 方式 ? 为 什么 ? 
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11. 阐述 CPU 的 取 指 - 译 码 -执行 周期 的 各 个 步 又， 请 详细 说 明 各 个 寄存 器 的 变化 过 程 。 
令 12. 解释 在 MARIE 中 ， 为 什么 MAR 寄存 器 是 12 位 ， 而 AC 寄存 器 的 宽度 是 16 位 ? 
13. 写 出 下 列 程序 对 应 的 十 六 进 制 数 代码 〈 并 对 程序 进行 编译 ) 。 


Label Hex Address Instruction 


100 Load A 
101 Add One 
102 Jump S1 
S25 103 Add One 
104 Store A- 
105 Halt 
S1， 106 Add A 
107 Jump S2 
A, 108 HEX 0023 
One, 109 HEX 0001 


令 14. 对 于 上 述 程序 ， 写 出 符号 表 中 的 内 容 。 
15. 已 知 本 章 介 绍 的 MARIE 指令 集 : 
a) 解密 下 列 MARIE 机 器 语言 指令 (利用 等 效 的 汇编 语言 写 出 这 些 指令 ) 
i) 0010000000000111 
ii) 1001000000001011 
ii) 0011000000001001 
b) 采用 MARIE 的 汇编 语言 书写 如 下 代码 段 : 
if X > 1 then 
了 
endif; 
和 
判断 一 下 : 如 果 有 如 下 代码 片断 〈 执 行 某 个 子 程序 的 操作 ) 在 MAR 下 机 器 上 和 运行， 可 能 会 出 现 的 
什么 潜在 问题 〈 可 能 多 于 一 个 问题 )? 这 个 子 程序 假设 了 要 传递 的 参量 存放 在 AC 中 ， 并 且 应 该 将 该 


_ 


_ 


C 





18. 


22. 


23. 
24. 
25, 


26 
27 
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参量 值 加 倍 。 程 序 的 主体 部 分 包括 一 个 调用 子 程序 的 例子 。 可 以 假定 这 个 程序 片断 是 某 个 大 程序 的 
一 部 分 。 
Main, Load X 
Jump Subl 
Sret, Store X 


Subl, Add X 
Jump Sret 


. 编写 一 个 MARIE 程序 ， 对 表达 式 A XB 十 CX D 进行 估 值 。 
. 利用 MARIE 的 汇编 语言 编写 如 下 的 代码 段 ， 


X := 1; 

while X < 10 do 
X :~ XX+1; 

endwhile:; 


利用 MARIE 的 汇编 语言 编写 如 下 的 代码 段 : 


Sum := 0; 
for X := 1 to 10 do 
Sum := Sum + X; 


. 采用 重复 相 加 的 方式 ,编写 一 个 包含 循环 过 程 的 MARIE 程序 ， 计 算 两 个 正 数 的 乘法 。 例 如 : 乘法 


3X6， 程 序 就 要 执行 6 次 加 法 , 或 3 十 3 十 3 十 3 十 3 十 3。 


， 编写 一 个 MARIE 的 子 程序 ， 实 现 两 个 数字 相 减 。 
. 使 用 更 多 寄存 器 有 利于 提高 CPU 的 工作 速度 ， 因 为 增加 寄存 器 的 数 旭 可 以 减少 程序 访问 存储 器 的 总 次 


数 。 列 举 一 个 算法 例子 来 证 明 上 述 观 点 。 首 先 ， 使 用 MARIE 确定 需要 访问 存储 器 的 次 数 ， 并 且 利 用 两 
个 寄存 器 来 保存 来 自 存储 器 的 数据 值 ‘AC 和 MBR)。 然 后 ， 对 于 一 个 采用 多 于 三 个 寄存 器 来 保存 存储 
器 数据 值 的 处 理 器 ， 执 行 与 上 面相 同 的 算法 计算 。 

MARIE 将 一 个 子 程序 的 返回 地 址 存放 到 存储 器 中 ， 存 储 单元 的 位 置 由 跳 转 -存储 (jump-and-store) 指 
令 来 指定 。 在 某 些 体系 结构 中 ， 这 个 返回 地 址 存放 在 一 个 寄存 器 肉 ， 大 多 数 情况 下 是 存放 在 堆栈 中 。 
请 问 : 这 两 种 方法 中 哪 种 方法 处 理 循 环 递归 效果 最 好 ? 并 解释 理由 。 

跟踪 描述 例 4-2 中 程序 的 细节 执行 过 程 〈 类 似 于 图 4-13) 。 

跟踪 描述 例 4-3 中 程序 的 细节 执行 过 程 〈 类 似 于 图 4-13)。 

假设 添加 下 面 的 一 条 指令 到 MARIE 的 指令 集中 : 

IncSsz Operand 

这 条 指令 的 作用 对 有 效 地 址 “Operand” 进 行 增 量 操作 ， 并 且 如 果 新 近 的 增 量 值 等 于 0， 程 序 计数 器 就 
加 1。 基 本 上 ， 我 们 是 对 操作 数 进行 增 量 处 理 ， 并 且 如 果 新 值 等 于 0， 则 跳 过 下 一 条 指令 。 说明 怎样 使 
用 RTN 来 编写 这 条 指令 。 


. 在 CPU 和 存储 器 之 间 ， 采 用 的 是 同步 总 线 ， 还 是 异步 总 线 ? 为 什么 ? 
.x 挑选 一 种 体系 结构 (不 属于 本 章 介 绍 的 体系 结构 )。 经 过 研究 揭示 出 这 个 体系 结构 是 怎样 来 处 理 本 章 引 


入 的 基本 概念 的 ， 就 像 Intel 和 MIPS 体系 结构 所 处 理 的 那样 。 


是 非 题 


1. 


如 果 一 台 计算 机 采用 硬 连 线 控制 ， 微 程序 将 决定 机 器 的 指令 集 。 这 个 指令 集 永远 都 不 能 改变 ， 除 非 对 这 
个 体系 结构 进行 重新 设计 。 


. 一 条 分 支 指令 是 通过 改变 PC 来 改变 信息 流 的 。 
. 寄存 器 是 CPU 内 部 本 身 的 存储 单元 。 
. 一 个 两 次 通读 〈two-pass) 的 编译 程序 ， 一 般 是 在 第 一 次 阅读 源 程序 时 生成 一 个 符号 表 ， 并 且 在 第 二 次 


阅读 时 完成 从 汇编 语言 到 机 器 语言 的 全 部 转换 任务 。 
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. MARIE 中 的 MAR、MBR、PC 和 IR 寄存 器 可 以 用 来 保存 任意 的 数据 值 。 

. MARIE 中 有 一 个 公用 总 线 的 配置 ， 这 意味 着 有 许多 实体 共享 这 条 总 线 。 

. 一 个 编译 器 是 一 个 程序 ， 这 个 程序 接受 一 个 符号 语言 ， 并 生成 一 个 等 效 的 二 进 制 机 器 语言 ， 在 汇编 语言 
的 源 程序 和 机 器 语言 的 目标 程序 之 间 产 生 一 一 对 应 的 关系 。 

. 如 果 一 台 计 算 机 采用 微 程序 控制 ， 那 么 微 程序 决定 机 器 的 指令 集 。 





每 个 程序 中 都 至 少 存 在 一 个 程序 缺陷 ， 而 且 每 个 程序 都 可 以 精简 为 至 少 一 条 指令 。 由 此 推断 ， 每 个 程序 
都 可 以 被 缩减 成 一 条 无 法 运行 的 指令 。 
-一 无 名 氏 


第 5 章 ， 指令 系统 体系 结构 概览 


5.1 概述 


计算 机 指令 由 操作 码 和 操作 数组 成 。 操 作 码 指定 要 执行 的 操作 类 型 ， 而 操作 数 指出 数据 所 处 的 寄 
存 器 和 内 存单 元 。 既 然 可 以 使 用 像 C++ 、Java 和 Ada 这 样 一 些 高 级 语言 ， 为 什么 还 需要 学 习 计算 机 
的 机 器 指令 呢 ? 在 使 用 高 级 语言 编程 时 ， 我 们 很 少 会 意识 到 第 4 章 (或 者 本 章 ) 所 讨论 的 一 些 概念 。 
原因 是 高 级 语言 隐藏 了 许多 有 关 计 算 机 体系 结构 的 细节 ， 利 用 高 级 语言 的 编程 人 员 通 常 看 不 见 这 些 有 
关 体 系 结构 的 细节 。 计 算 机 公司 通常 喜欢 雇用 一 些 具有 汇编 语言 背景 的 程序 员 ， 并 不 是 因为 他 们 需要 
汇编 语言 的 程序 员 ， 而 是 因为 他 们 需要 一 些 理解 计算 机 体系 结构 的 程序 员 ， 以 便 使 编写 的 程序 更 高 效 ， 
运行 更 加 顺畅 。 

” 本 章 会 对 上 一 章 的 内 容 做 进一步 的 展开 ， 深 入 讨论 计算 机 的 指令 系统 体系 结构 。 将 介绍 各 种 不 同 的 
指令 类 型 和 操作 数 类 型 ， 以 及 指令 如 何 访问 内 存 中 的 数据 。 不 同体 系 结构 的 计算 机 系统 具有 不 同 的 指令 
系统 。 学 习 指 令 系 统 的 设计 构成 和 指令 的 工作 方式 ， 有 助 于 理解 更 复杂 的 计算 机 体系 结构 的 具体 细节 。 


5.2 ”指令 格式 


每 条 计算 机 的 指令 都 有 一 个 操作 码 和 0 个 或 多 个 操作 数 。 第 4 章 中 的 MARIE 的 指令 长 度 为 16 
位 ， 且 最 多 只 有 一 个 操作 码 。 指 令 系统 的 编码 方式 是 多 种 多 样 的 。 随 着 体系 结构 的 不 同 ， 机 器 指令 使 
用 的 二 进 制 数 的 位 数 也 可 能 不 同 〈 最 常用 的 机 器 指令 长 度 是 16 位 、32 位 和 64 位)， 每 条 指令 允许 使 用 
的 操作 数 的 个 数 不 同 ， 指 令 的 类 型 和 指令 处 理 的 操作 数 的 类 型 也 可 能 不 同 。 更 具体 地 说 ， 各 种 指令 集 
可 能 在 特征 上 存在 如 下 差别 : 

。 操作 数 在 CPU 中 的 存储 方式 数据 可 以 存储 在 堆栈 结构 或 寄存 器 中 ) 

。 指 令 直接 作用 的 操作 数 的 数目 (最 常用 的 操作 数 个 数 为 0、1、2 和 3) 

。 操 作 数 的 位 置 (如 果 简 单 地 按照 指令 适用 的 操作 数 的 组 合 ， 则 各 种 指令 可 以 分 为 寄存 器 -寄存 器 

类 型 、 寄 存 器 -存储 器 类 型 或 存储 器 -存储 器 类 型 ) 

。 操作 〈 不 仅 包 括 操作 的 类 型 ， 而 且 指出 指令 是 否 可 以 访问 存储 器 ) 

“操作 数 的 类 型 和 长 度 〈 操 作 数 可 能 是 地 址 、 数 字 或 字符 ) 


5.2.1 指令 系统 的 设计 


在 设计 计算 机 的 体系 结构 时 ， 必 须 首 先 确定 计算 机 指令 系统 的 格式 。 各 种 计算 机 系统 设计 中 所 选 
择 的 指令 体系 结构 通常 会 有 很 大 差别 ， 原 因 是 不 同 的 体系 结构 必须 配备 不 同 的 指令 系统 。 精 心 设计 的 
指令 系统 和 体系 结构 通常 可 以 持续 使 用 许多 年 。 因 此 ， 在 计算 机 的 设计 阶段 所 做 出 的 各 种 决定 会 具有 
较 长 远 的 影响 。 

指令 系统 体系 结构 〈ISA) 的 效能 可 以 用 下 面 几 个 因素 来 衡量 : 〈1) 程序 执行 指令 时 占用 内 存 空 
间 的 大 小 ; (2) 指令 系统 的 复杂 程度 ， 主 要 指 指令 执行 所 需要 的 译 码 数量 和 指令 所 执行 的 任务 的 复杂 
性 ; (3〉 指 令 的 长 度 ; (4) 指令 系统 中 指令 的 总 数目 。 设 计 指 令 系 统 时 需要 考虑 的 问题 包括 : 

。 指令 一 般 越 短 越 好 ， 因 为 较 短 的 指令 占用 较 少 的 内 存 空间 ， 并 且 提 取 指 令 的 速度 也 会 更 快 。 但 

是 ， 采 用 短 指 令 会 限制 指令 的 数量 。 因 为 指令 的 数量 受到 指令 中 能 够 进行 编码 的 二 进 制 数 的 位 
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数 的 限制 。 同 样 ， 较 短 的 指令 也 会 极 大 地 限制 操作 数 的 大 小 和 数量 。 

。 固 定 长 度 的 指令 的 译 码 相 对 比较 容易 ， 但 却 浪 费 空间 。 

。 存储器 的 组 成 形式 会 影响 指令 的 格式 。 例 如 ， 如 果 存 储 器 有 16 位 或 32 位 字 ， 而 且 不 是 按 字 节 编 
址 的 ， 那 么 就 很 难 访问 一 个 单一 字符 。 基 于 这 种 理由 ， 甚 至 有 些 16 位 、32 位 或 64 位 字 的 机 器 
通常 也 是 按 字 节 编 址 设计 的 ， 也 就 是 说 每 个 字 节 都 有 一 个 唯一 的 地 址 ， 即 使 这 些 机 器 的 字 都 大 
于 一 个 字 巷 攻 

。 固 定 长 度 的 指令 系统 并 不 表示 必须 使 用 固定 数量 的 操作 数 。 我 们 可 以 设计 一 个 指令 总 长 度 固定 的 
指令 系统 体系 结构 (ISA)， 但 是 却 可 以 允许 操作 数 域 的 位 数 根据 需要 而 改变 。 这 种 指令 系统 体 
系 结构 称 为 扩展 操作 码 (expanding opcode)， 将 在 第 5. 2. 5 节 详 细 讨 论 。 

。 存 在 多 种 不 同类 型 的 寻 址 方法 。 第 4 章 ，MARIE 的 设计 中 就 采用 了 两 种 寻 址 方法 : 直接 寻 址 和 
间接 寻 址 。 在 本 章 中 ， 读 者 将 会 发 现 还 有 更 多 的 寻 址 方法 。 

。 如 果 机 器 的 字 由 多 个 字 节 组 成 ， 就 需要 考虑 组 成 字 的 字 节 是 按照 怎样 的 次 序 存储 到 按 字 节 编 址 的 
机 器 存储 器 中 ? 例如 ， 最 低位 的 字 节 到 底 是 存放 在 最 高 字 节 地 址 ， 还 是 最 低 字 节 地 址 。 这 是 一 个 
有 关 小 端 和 大 端的 位 序 问 题 ， 将 留 在 下 一 部 分 讨论 。 

。 设 计 的 体系 结构 需要 多 少 个 寄存 器 且 这 些 寄存 器 应 该 如 何 进 行 组 织 安排 ? 操作 数 如 何 存放 在 
CPU 中 ? 

小 端 和 大 端的 位 序 、 扩 展 操 作 码 和 CPU 寄存 器 的 组 成 将 在 下 面 的 内 容 作 深入 讨论 。 与 此 同时 ,我 

们 也 会 介绍 上 面 列 出 的 其 他 一 些 设计 问题 。 


5.2.2 小 端 和 大 端的 位 序 问 题 


术语 一 一 位 端 〈endian) 指 的 是 计算 机 体系 结构 中 的 “位 序 ”(byte order) 。 或 者 说 ， 位 端 是 指 在 
计算 机 中 存储 一 个 多 字 节 数据 元 素 时 ， 各 个 字 节 的 排列 方式 。 事 实 上 ， 当 今 所 有 的 计算 机 体系 结构 都 
是 按 字 节 编 址 的 。 因 此 ， 必 须 对 存储 多 于 单一 字 节 的 信息 的 方法 制定 一 个 标准 。 例 如 ， 某 些 计算 机 在 
存储 一 个 2 字 节 整数 时 ， 将 最 低位 的 字 节 首先 存放 到 低位 地 址 ， 然 后 再 将 最 高 位 的 字 节 存放 到 高 位 地 
址 。 这 样 一 来 ,位 于 较 低 地 址 的 字 节 就 是 数据 信息 的 最 低位 。 采 用 这 种 方式 的 机 器 称 为 小 端 (little 
endian) 机器。 而 其 他 的 一 些 机 器 在 存储 同样 的 2 字 节 整数 时 ， 则 是 先 将 最 高 位 的 字 节 存放 到 低位 地 
址 ， 然 后 再 存放 最 低位 的 字 节 。 这 种 类 型 的 机 器 称 为 大 端 (big endian) 机 器 ， 原 因 是 他 们 将 最 高 位 的 
字 节 存放 在 低位 地 址 。 大 部 分 的 UNIX 计算 机 都 是 大 端 机 器 ， 而 大 多 数 的 PC 机 则 是 小 端 机 器 。 大 部 
分 新 式 的 RISC 体系 结构 也 都 是 大 端 机 器 。 

小 端 和 大 端 这 两 个 术语 来 自 小 说 《 格 利 弗 游记 》(Gulliver's Travels) 。 读 者 也 许 还 记得 ， 在 这 个 故 
事 中 ， 小 人 国 里 的 小 人 分 成 两 大 阵营 : 其 中 一 部 分 小 人 敲 破 鸡 蛋 “ 大 ”的 一 头 吃 鸡蛋 (big endian)， 
而 另 一 部 分 小 人 则 敲 破 鸡 蛋 “ 小 ”的 一 头 吃 鸡蛋 (little endian) 。CPU 制造 商 同 样 也 分 成 两 类 。 例 如 ， 
Intel 总 是 使 用 “小 端 ” 方 式 来 设计 机 器 ， 而 Motorola 却 总 是 采用 “大 端 ”方式 。 值 得 一 提 的 是 ， 有 些 
CPU 既 能 处 理 小 端 问题 也 能 处 理 大 端 问题 。 

例如 ， 考 虑 如 下 所 示 的 一 个 由 4 字 节 组 成 的 整数 : 






在 小 端 机 器 中 ， 这 个 整数 在 存储 器 里 面 的 安排 顺序 为 : 


Base Address + 0 = Byte0 
Base Address + 1 = Bytel 
Base Address + 2 = Byte2 
Base Address + 3 = Byte3 


而 在 一 个 大 端 机 器 中 * 这 个 长 整数 将 按 如 下 的 方式 存储 : 
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Base Address + 0 = Byte3 
Base Address + 1 = Byte2 
Base Address + 2 = Bytel 
Base Address + 3 = Byte0 


假设 现在 有 一 个 按 字 节 编 址 的 机 器 ， 要 将 一 个 32 位 16 进 制 数值 12345678 存储 在 地 址 0 的 存储 单 


元 。 每 个 十 六 进 制 的 数字 都 需要 半 个 字 节 ， 所 以 一 个 字 节 可 以 保存 两 个 数字 。 这 个 十 六 进 制 数值 将 按 
照 如 图 5-1 所 示 的 不 同方 式 存储 在 存储 器 中 ， 图 中 阴影 部 分 表示 存储 器 中 的 实际 内 容 。 
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图 5-1 十 六 进 制 数值 12345678 分 别 按 大 端 和 小 端的 格式 存储 

这 两 种 方法 各 有 优 缺 点 ， 不 能 断言 哪 种 方法 更 好 一 些 。 对 于 大 多 数 人 来 说 ， 大 端 位 序 的 存储 方式 
更 自然 些 ， 而 且 更 便于 阅读 十 六 进 制 数 编写 的 程序 段 。 因 为 最 高 位 的 字 节 首先 进行 处 理 ， 所 以 总 是 可 
以 通过 检查 位 于 最 高 位 的 符号 位 来 判断 这 个 数字 的 正 负 (而 对 于 小 端 位 序 的 存储 方式 ， 则 必须 先 要 知 
道 数值 的 长 度 ， 然 后 跳 过 中 间 字 节 找 到 包含 符号 信息 的 字 节 ) 大 端 位 序 的 机 器 存储 整数 和 字符 串 时 使 
用 相同 的 次 序 ， 并 且 在 某 些 字符 串 操 作 时 速度 会 更 快 一 些 。 大 部 分 位 图 映射 格式 的 图 像 都 是 采用 “最 
高 位 在 字符 串 的 左边 ”的 变换 方法 ， 也 就 是 说 对 于 像素 大 于 一 个 字 节 的 数据 可 以 直接 按照 大 端 位 序 机 
器 自身 体系 结构 的 安排 顺序 进行 处 理 。 而 对 于 小 端 位 序 的 机 器 来 说 ， 在 处 理 一 些 较 大 的 图 形 对 象 时 ， 
其 性 能 上 会 受到 某 些 限制 。 原 因 在 于 这 些小 端 机 器 需要 不 断 地 反 转 处 理 这 类 图 形 数据 的 字 节 的 排列 次 
序 。 当 对 采用 像 赫 夫 曼 (Huffman) 和 LZW 这 类 方案 (这 些 编码 方法 将 在 第 7 章 讨论 ) 编码 的 压缩 数 
据 进行 译 码 时 ， 如 果 数 据 采用 的 大 端 位 序 的 存储 方式 ， 那 么 实际 的 编码 字 可 以 被 当 作 进入 到 某 个 查询 
表 中 的 一 个 索引 来 使 用 编码 的 情况 也 是 如 此 )。 

当然 ， 大 端 位 序 的 存储 方式 也 有 缺点 。 如 果 计 算 机 要 进行 从 32 位 整数 地 址 到 16 位 整数 地 址 的 转 
换 操作 ， 则 要 求 大 端 机 器 执行 加 法 运算 。 高 精度 的 算术 运算 在 小 端 机 器 上 会 更 快 和 更 方便 一 些 。 大 部 
分 采用 大 端 位 序 方案 的 体系 结构 都 不 允许 计算 机 字 按 照 非 字 地 址 边界 的 方法 来 写 (存储 ) 数据 字 。 例 
如 ， 如 果 一 个 字 由 2 或 4 个 字 节 组 成 ， 写 数据 字 时 就 必须 从 一 个 偶数 编号 的 字 节 地 址 开始 。 这 样 做 显 
然 会 浪费 存储 空间 。 而 对 于 像 Intel 这 类 的 小 端 位 序 机 器 ， 则 允许 进行 奇数 地 址 的 读 写 。 这 样 可 以 使 得 
在 这 类 机 器 上 的 编程 会 变 得 更 加 方便 。 假 如 一 个 程序 员 编 写 了 某 条 指令 来 读 取 一 个 字 长 度 出 错 的 数值 。 
如 果 这 条 指令 在 大 端 机 器 上 执行 时 ， 读 取 的 总 是 一 个 错误 的 数值 ;而 对 于 小 端 机 器 来 说 ， 则 指令 有 时 
候 可 能 会 产生 一 个 正确 的 读 取 数 据 。 当 然 ，Intel 公司 最 后 也 在 指令 系统 中 增加 了 一 条 指令 ， 用 来 反 转 
寄存 器 中 的 字 节 的 次 序 。 

计算 机 网 络 都 是 采用 大 端 位 序 的 体系 结构 。 这 就 意味 着 ， 如 果 小 端 位 序 机 器 要 将 整数 数据 〈 例 如 ， 
网 络 设备 地 址 ) 传送 到 网 络 上 时 ， 必 须 将 这 些 数据 转换 成 网 络 所 要 求 的 字 节 次 序 。 同 样 ， 小 端 机 器 从 
网 络 上 接收 整数 数据 时 ， 也 需要 将 这 些 数据 转换 回 它 们 自己 的 本 地 表示 形式 。 

尽管 读者 可 能 对 有 关 小 端 和 大 端 位 序 的 争论 不 太 熟悉 ,但 是 这 一 问题 在 现在 的 许多 软件 应 用 中 却 
是 非常 重要 的 。 任 何 程序 在 从 某 个 文件 中 读 写 数据 时 ， 都 必须 搞 清 楚 所 运行 的 计算 机 中 的 字 节 次 序 。 
例如 ， 因 为 Windows BMP 图 形 格式 是 基于 小 端 机 器 开发 的 。 所 以 如 果 要 在 大 端 机 器 上 观看 BMP 图 
形 ， 用 来 处 理 这 类 图 形 格式 的 应 用 程序 就 必须 首先 反 转 数据 的 位 序 。 当 然 ， 通 用 软件 的 设计 人 员 都 非 
常 清楚 这 类 的 位 序 问题 。 例 如 ， 应 用 软件 Adobe Photoshop 使 用 大 端 位 序 ，GIF 是 小 端 格式 ， 而 JPEG 
属于 大 端 格式 ; Macpaint 使 用 大 端 位 序 格式 ，PC Paintbrush 采用 小 端 格式 ， 而 Microsoft 的 RTF 也 是 
使 用 小 端 位 序 结构 ， 而 Sun 光栅 文件 却 属 于 大 端 格 式 。 有 些 应 用 程序 可 以 同时 支持 上 面 的 两 种 格式 : 
例如 ，Miciosoft 的 WAV 文件 和 AvVI 文 件 ，TIFF 文件 ， 以 及 XWD (X Windows Dump) 就 支持 两 种 
格式 ， 通 常 可 以 通过 将 一 个 标识 符 编 码 到 文件 中 来 实现 。 
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5.2.3 CPU 的 内 部 存储 机 制 : 堆栈 和 寄存 器 


当 存 储 器 的 位 序 确 定之 后 ， 硬 件 设 计 人 员 需 要 决定 CPU 存储 数据 的 方式 。CPU 的 数据 存储 方式 
是 区 分 不 同 指令 系统 体系 结构 〈JSA) 的 最 基本 的 方法 。 这 里 有 三 种 不 同 的 体系 结构 可 供 选 择 : 

1. 堆栈 体系 结构 

2， 累加 器 体系 结构 

3. 通用 寄存 器 (GPR) 体系 结构 

堆栈 体系 结构 (stack architecture) 的 计算 机 使 用 一 个 堆栈 来 执行 各 种 指令 ， 而 且 指 令 的 操作 数 就 
隐 含 地 存放 在 堆栈 的 顶部 。 按 照 堆栈 体系 结构 设计 的 机 器 通常 具有 好 的 编码 密度 和 一 个 简单 的 表达 式 
估 值 模型 ， 但 是 由 于 不 能 对 堆栈 进行 随机 访问 ， 使 得 采用 堆栈 结构 的 机 器 很 难产 生 高 效率 的 编码 。 累 
加 器 体系 结构 《Accumulator architecture) 的 计算 机 ， 比 如 MARIE， 是 将 其 中 一 个 操作 数 隐 仿 在 累加 
器 中 。 这 样 可 以 最 大 限度 地 降低 机 器 的 内 部 复杂 性 ， 而 且 人 允许 使 用 非常 短 的 指令 。 但 是 由 于 累加 器 只 
是 临时 存储 ， 所 以 这 类 机 器 的 对 存储 器 的 访问 非常 频繁 。 通 用 寄存 器 体系 结构 〈general purpose regis- 
ter architecture) 的 计算 机 ， 采 用 多 个 通用 寄存 器 组 ， 这 是 当今 计算 机 体系 结构 中 最 广泛 接受 的 模型 。 
这 些 寄存 器 组 的 访问 速度 比 存储 器 快 得 多 ， 非 常 方便 编译 器 进行 处 理 ， 并 且 可 以 士 分 有 效 和 高 效 地 使 
用 。 另 外 ， 由 于 硬件 的 价格 急剧 下 降 ， 所 以 现在 可 以 以 较 少 成 本 增加 大 量 数目 的 寄存 器 。 如 果 存 储 器 
的 速度 快 ， 堆 栈 体系 结构 的 设计 可 能 是 一 个 好 方法 ; 如 果 存 储 器 的 速度 慢 ， 通 常 采用 通用 寄存 器 体系 
结构 的 设计 会 比较 好 。 当 然 ， 大 家 有 许多 理由 可 以 解释 为 什么 最 近 10 年 来 大 部 分 的 计算 机 都 使 用 通用 
寄存 器 体系 结构 。 但 是 ， 由 于 所 有 的 操作 数 都 必须 加 以 命名 指定 ， 所 以 使 用 寄存 器 结构 会 产生 较 长 的 
指令 ， 导 致 较 长 的 取 指 时 间 和 译 码 时 间 。 对 ISA 设计 人 员 来 说 ， 其 中 一 个 非常 重要 的 目标 是 实现 短 指 
令 。 设 计 人 员 在 选择 某 个 指令 系统 体系 结构 时 ， 应 该 明确 这 种 体系 结构 可 以 在 某 个 特定 的 环境 中 的 工 
作 效 能 性 能 最 佳 ， 而 且 需 要 对 各 种 可 能 的 方案 仔细 作出 权衡 。 

通用 寄存 器 体系 结构 可 以 根据 指令 的 操作 数 所 处 的 位 置 分 成 汪 种 类 型 。 存 储 器 -存储 器 (memory- 
memory) 体系 结构 可 以 有 两 个 或 三 个 操作 数位 于 存储 器 内 ， 人 允许 有 一 条 执行 某 种 操作 而 不 需要 有 任何 
操作 数 的 指令 存放 在 某 个 寄存 器 中 。 寄 存 器 -存储 器 (register-memory) 体系 结构 则 是 采用 混合 方式 ， 
这 其 中 至 少 有 一 个 操作 数 在 寄存 器 中 和 一 个 操作 数 在 存储 器 中 。 装 入 -存储 〈load-store) 式 体系 结构 则 
需要 在 任何 对 数据 的 操作 执行 之 前 ， 先 将 数据 装 人 寄存 器 中 。jintel 和 Motorola 的 计算 机 系统 属于 寄存 
器 -存储 器 体系 结构 ;数字 仪器 公司 的 VAX 计算 机 的 体系 结构 实行 的 是 存储 器 -存储 器 操作 ; 而 
SPARC、MIPS、ALPHA 和 PowerPC 都 是 装 人 -存储 式 体系 结构 的 计算 机 。 

今天 ， 大 部 分 体系 结构 都 是 采用 以 通用 寄存 器 为 基础 (GPR-based) 设计 的 。 下 面 ， 我 们 讨论 用 
来 区 分 通用 寄存 器 体系 结构 的 有 关 指 令 系统 的 两 个 主要 特性 。 这 两 个 特性 就 是 指令 的 操作 数 的 数目 和 
操作 数 的 编 址 方式 。 在 第 5. 2. 4 节 中 ， 我 们 将 考虑 指令 的 长 度 和 指令 所 包含 的 操作 数 的 数目 问题 。 对 
于 通用 寄存 器 体系 结构 ， 一 条 指令 具有 两 个 或 三 个 操作 数 是 很 常见 的 。 我 们 会 对 这 些 采 用 多 操作 数 指 
令 的 体系 结构 与 不 使 用 或 只 使 用 一 个 操作 数 指令 的 体系 结构 进行 比较 研究 ， 然 后 再 讨论 有 关 指 令 的 类 
型 问题 。 最 后 在 第 5. 4 节 ， 我 们 将 介绍 现在 的 计算 机 系统 中 所 采用 的 各 种 编 址 方式 。 


5. 2. 4 操作 数 的 数目 和 指令 的 长 度 


描述 计算 机 体系 结构 的 传统 方法 是 指定 每 条 指令 中 所 包含 的 操作 数 ， 或 者 说 地 址 的 最 大 数目 。 这 
种 做 法 会 对 指令 自身 的 长 度 产 生 直 接 影 响 。MARIE 使 用 的 是 固定 长 度 的 指令 ， 其 中 包括 一 个 4 位 的 操 
作 码 和 一 个 12 位 的 操作 数 。 在 现在 的 计算 机 体系 结构 中 ， 指 令 构成 的 格式 有 如 下 的 两 种 方式 : 

。 固 定 长 度 (fixed length) ”使 用 这 种 格式 的 指令 系统 会 浪费 一 些 存储 空间 ， 但 是 指令 执行 的 速度 

快 。 在 采用 指令 层次 (instruction-level) 的 流水 线 结构 时 ， 固 定 长 度 的 指令 系统 的 性 能 会 更 好 

些 。 详 见 第 5. 5 节 。 
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。 可 变 长 度 〈variable length) 这 种 指令 系统 的 译 码 会 变 得 比较 复杂 ， 但 是 却 可 以 节省 存储 空间 。 

在 实际 设计 中 ， 通 常会 考虑 一 些 折衷 的 方案 ,采用 两 到 三 种 不 同 的 指令 长 度 。 这 样 可 以 有 不 同 的 
位 的 组 合 形式 ， 便 于 简化 指令 的 区 分 和 译 码 。 当 然 ， 指 令 的 长 度 还 必须 配合 机 器 字 的 长 度 。 如 果 指 令 
的 长 度 严 格 等 于 机 器 字 的 长 度 ， 那 么 在 将 指令 存储 到 主 存储 器 时 ， 指 令 间 的 对 齐 问 题 就 会 变 得 非常 完 
美 。 由 于 存储 器 需要 编 址 的 缘故 ， 指 令 总 是 按照 机 器 字 的 长 度 对 齐 。 所 以 ， 那 些 采 用 实际 机 器 字 长 度 
的 四 分 之 一 、 二 分 之 一 、 两 倍 或 三 倍 长 度 的 指令 会 浪费 不 少 的 存储 空间 。 可 变 长 度 指 令 的 长 度 显 然 并 
不 都 相同 ， 同 样 要 求 按 机 器 字 进 行 对 齐 ， 这 样 也 会 造成 存储 空间 的 损失 。 

最 常用 的 指令 格式 包括 有 零 个 、 一 个 、 两 个 或 三 个 操作 数 。 第 4 章 介绍 的 MARIE 机 器 的 某 些 指 
令 不 包含 操作 数 ， 而 剩 下 的 其 他 指令 都 带 有 一 个 操作 数 。 通 常情 况 下 ,算术 运算 或 逻辑 运算 需要 两 个 
操作 数 。 但 是 ， 如 果 将 累加 器 当 作 为 一 个 隐 含 的 操作 数 ， 那 么 这 些 两 个 操作 数 的 操作 也 可 以 按照 一 个 
操作 数 指令 的 方式 来 执行 ， 正 如 MARIE 中 所 执行 的 那样 。 如 果 把 最 终 目 标 地 址 作为 第 三 个 操作 数 ， 
那么 从 设计 上 就 可 以 将 这 种 思想 扩展 到 三 个 操作 数 的 情形 。 同 样 ， 使 用 一 个 堆栈 结构 也 可 以 允许 有 不 
带 操作 数 〈 零 操作 数 ) 的 指令 。 下 面 是 几 种 常用 的 指令 格式 : 

。 只 有 操作 码 (0 地 址 ) 

。 操 作 码 十 1 个 地 址 (通常 只 有 一 个 存储 器 地 址 ) 

“ 操作 码 十 2 个 地 址 (通常 是 两 个 寄存 器 地 址 ， 或 者 是 一 个 寄存 器 地 址 加 上 一 个 存储 器 地 址 ) 

“操作 码 十 3 个 地 址 (通常 是 三 个 寄存 器 地 址 ,或 者 是 寄存 器 和 存储 器 的 某 种 组 合 形 式 ) 

对 每 种 体系 结构 来 说 ， 每 条 指令 所 允许 的 最 大 操作 数 的 数目 是 有 限制 的 。 例 如 ， 在 MARIE 中 ， 
指令 的 最 大 的 操作 数 为 1， 当然 ， 某 些 指令 可 以 没有 操作 数 (Halt 和 skipcond)。 前 面 已 经 介绍 了 ， 
零 操 作 数 、 一 个 操作 数 、 两 个 操作 数 和 三 个 操作 数 是 最 常用 的 指令 格式 。 对 于 包含 一 个 操作 数 、 两 个 
操作 数 ， 或 者 甚至 三 个 操作 数 的 指令 格式 读者 比较 容易 理解 。 但 是 ， 如 果 一 个 指令 系统 体系 结构 
(ISA) 开始 就 完全 由 零 操 作 数 的 指令 组 成 ， 反 而 会 令 人 感到 有 些 困惑 难 解 。 

不 带 操作 数 的 机 器 指令 必须 使 用 堆栈 来 执行 在 逻辑 上 需要 一 个 或 两 个 操作 数 的 操作 〈 例 如 ， 一 个 
Add 指令 ) 。 堆 栈 是 第 4 章 引 入 的 一 种 后 进 先 出 〈last-in，first-out) 的 数据 结构 ， 堆 栈 中 的 所 有 数据 插 
人 和 删除 都 必须 从 堆栈 顶部 进行 ， 这 些 内 容 将 在 附录 A 中 进行 详细 讨论 。 由 于 没有 采用 通用 寄存 器 ， 
基于 堆栈 的 体系 结构 将 操作 数 存放 在 堆栈 的 顶部 ，CPU 可 以 访问 堆栈 顶部 的 数据 元 素 。 堆 栈 是 计算 机 
体系 结构 中 最 重要 的 数据 结构 之 一 。 堆 栈 这 种 数据 结构 不 但 可 以 为 各 种 复杂 计算 操作 的 中 间 结 果 提 供 
了 一 种 非常 有 效 的 数据 存储 方式 ， 而 且 为 程序 过 程 调用 中 的 参数 传递 提供 了 一 种 有 效 方法 。 另 外 ， 堆 
栈 也 为 存放 局 部 程序 模块 和 界定 子 程序 和 变量 的 界限 范围 提供 了 某 些 非常 有 用 的 方法 。 

在 基于 堆栈 的 计算 机 体系 结构 中 ， 大 部 分 机 器 指令 都 只 包含 操作 码 。 但 是 ， 有 些 特 殊 指令 ， 例 如 
往 堆 栈 中 加 入 元 素 和 从 堆栈 中 移 除 元 素 的 指令 ， 往 往 会 带 有 一 个 单一 的 操作 数 。 堆 栈 结构 需要 有 一 个 
入 栈 〈push) 指令 和 一 个 出 栈 (pop) 指令 ， 这 两 个 指令 都 必须 带 有 一 个 操作 数 。Push x 指令 表示 将 
地 址 为 X 的 存储 器 单元 内 的 数据 值 放 到 堆栈 中 。Pop x 表示 移 走 堆栈 顶部 的 元 素 并 将 其 存放 到 地 址 为 
X 的 存储 器 单元 中 。 堆 栈 体系 结构 中 ， 只 有 某 些 特定 的 指令 才 允 许 访 问 存储 器 ， 其 他 全 部 指令 必须 使 
用 堆栈 作为 指令 执行 所 要 求 的 操作 数 。 

对 于 要 求 两 个 操作 数 的 操作 ， 堆 栈 结构 采用 堆栈 顶部 最 上 面 的 两 个 元 素 作 为 操作 数 。 例 如 ， 如 果 
要 执行 加 法 (add) 指令 ，CPU 首先 将 堆栈 顶部 的 两 个 元 素 相 加 ， 并 且 把 这 两 个 最 上 面 的 元 素 弹出 移 
走 ， 最 后 再 将 求 和 结果 压 人 存放 到 推 栈 的 顶部 。 对 于 操作 次 序 不 能 交换 的 各 种 操作 ， 同 样 也 是 对 堆栈 
顶部 最 上 面 的 两 个 数据 元 素 按 次 序 进 行 。 例 如 减法 操作 ， 首 先 将 位 于 堆栈 顶部 最 上 面 的 第 二 个 元 素 减 
去 堆栈 顶部 的 第 一 个 元 素 ， 然 后 弹出 堆栈 顶部 最 上 面 的 这 两 个 元 素 ， 最 后 的 计算 结果 也 同样 会 被 压 回 
到 堆栈 顶部 的 单元 中 。 

堆栈 的 这 种 组 成 结构 ， 对 于 计算 采用 反 向 波兰 表示 法 (reverse Polish notation，RPN) 编写 的 长 
算术 表达 式 非常 有 效 。 反 向 波兰 表示 法 将 算 符 放 在 操作 数 的 后 面 ， 称 为 后 缓 表示 法 (postfix notation) 。 
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作为 对 比 ， 还 有 前 组 表示 法 (prefix notation) ， 即 把 算 符 放 在 操作 数 的 前 面 ; 中 组 表示 法 (infix nota- 
tion) 将 算 符 放 在 两 个 操作 数 的 中 间 。 例 如 : 
X 十 Y 为 中 缀 表示 法 
十 XY 是 前 缀 表示 法 
XY 十 是 后 缀 表示 法 
所 有 的 算术 表达 式 都 可 以 写成 上 述 三 种 表示 法 之 一 。 不 过 ， 使 用 后 缀 表示 法 ， 并 加 上 寄存 器 堆栈 
的 组 合 是 估 值 算术 表达 式 最 有 效 的 方法 。 事 实 上 ， 有 些 电子 计算 器 〈 例 如 惠普 公司 的 产品 ) 就 是 要 求 
用 户 使 用 后 缀 表示 法 的 方式 输入 方程 式 。 只 要 有 少许 计算 器 的 操作 经 验 ， 就 可 以 快速 地 对 包含 多 层 幅 
套 括 号 结构 的 长 表达 式 进 行 估 值 运算 ， 而 无 需 思考 项 是 如 何 组 合 的 。 
考虑 下 面 的 表达 式 
(X 十 Y) x (WO—2) 十 2 
使 用 反 向 波兰 表示 法 (RPN)， 上 面 的 表达 式 变 为 : 
XY++ WZ 一 X2 十 
注意 ， 在 使 用 反 向 波兰 表示 法 后 ， 原 来 用 来 保持 计算 次 序 的 括号 都 被 消除 了 。 


4 种 格式 ， 编 写 一 段 对 一 个 算术 表达 式 进行 估 值 的 简单 程序 。 

例 5-1 假设 对 下 面 的 表达 式 进行 估 值 计算 : 

Z= (XXY) + (WXxU) 

通常 ， 当 表达 式 需 要 三 个 操作 数 时 ， 至 少 必须 有 一 个 操作 数 是 一 个 寄存 器 。 并 且 第 一 个 操作 数 一 
般 为 目标 操作 数 。 采 用 3 地 址 指令 ， 估 值 表 达 式 Z 的 程序 代码 如 下 : 

Mult R1, X,Y 

Mult R2, W, U 

Add 2, R2, Rl 


如 果 使 用 2 地 址 指令 ， 通 常 其 中 的 一 个 地 址 要 指定 某 个 寄存 器 ， 而 另外 一 个 操作 数 则 可 以 是 一 个 
寄存 器 或 存储 器 地 址 。 在 2 地 址 指令 结构 中 ， 我 们 很 少 会 将 两 个 操作 数 都 表示 为 存储 器 地 址 。 采 用 2 
地 址 指令 ， 这 段 程序 代码 变 为 : 


Load R1, X 
Mult Ri, YY 
Load R2, W 
Mult R2, U 
Add R1, R2 


Store ZzZ, Rl 


注意 ， 搞 清 第 一 个 操作 数 是 源 操 作 数 还 是 月 标 操作 数 是 非常 重要 的 。 在 上 面 的 指令 中 ， 我 们 很 定 
了 第 一 个 操作 数 为 目标 操作 数 。 对 于 需要 将 程序 代码 在 Intel 汇编 请 言 和 Motorola 汇编 请 言 之 间 进 行 
转换 的 程序 员 来 说 ， 这 一 点 往往 会 造成 麻烦 ， 原 因 是 Intel 的 汇编 语言 指定 第 一 个 操作 数 为 且 标 操作 
数 ， 而 Motorola 的 汇编 语言 却 把 第 一 个 操作 数 作为 源 操作 数 。 

如 果 使 用 1 地 址 指令 〈 正 如 MARIE 中 的 情形 ) 必须 假定 一 个 寄存 器 〈 通 常 是 累加 器 ) 为 默认 指 
令 结 果 的 目标 操作 数 。 这 样 ， 估 值 Z 的 1 地 址 指令 程序 代码 为 : 


Load X 
Muit Y 
Store Temp 
Load W 
Mult U 
Add Temp 


Store Z 
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注意 ， 随 着 每 条 指令 所 允许 的 操作 数 的 数目 的 减少 ， 完 成 相同 程序 功能 所 需 的 指令 数目 将 会 增加 。 
这 就 是 一 个 典型 的 在 空间 和 时 间 之 间 进 行 平衡 折衷 的 例子 。 通 常 ， 采 用 较 短 的 指令 需要 编写 较 长 的 程 
序 。 

下 面 来 看 一 看 ， 如 果 在 一 台 使 用 0 地 址 指令 的 堆栈 结构 的 计算 机 中 ， 上面 的 这 个 程序 会 是 什么 样 
子 ? 基于 堆栈 结构 的 计算 机 的 一 些 指 令 ， 如 Add、sSubt、Mult 或 Divide， 都 没有 操作 数 。 这 里 需要 
的 是 一 个 堆栈 和 对 堆栈 执行 的 两 种 操作 : Pop (出 栈 ) 和 Push (人 栈 )。 而 与 堆栈 进行 通信 的 操作 都 必 
须 包 含 一 个 地 址 域 ， 用 来 指定 操作 数 是 从 堆栈 弹出 还 是 被 压 人 堆栈 。 除 此 之 外 的 其 他 所 有 操作 都 是 0 
地 址 指令 。Push 指令 把 操作 数 存放 到 堆栈 的 顶部 ， 而 Pop 指令 将 堆栈 顶部 的 内 容 移出 来 当 作 操作 数 。 
在 这 种 体系 结构 中 ， 估 值 上 述 的 方程 式 所 需要 编写 的 程序 是 最 长 的 。 假 设 这 种 结构 的 计算 机 使 用 堆栈 
顶部 最 上 面 的 两 个 操作 数 执行 各 种 算术 运算 ， 然 后 弹出 最 上 面 的 两 个 操作 数 ， 并 将 运算 结果 压 人 堆栈 
顶 。 原 来 的 程序 代码 就 变 为 : 

Push XxX 

Push ~ 

Mult 

Push W 

Push U 

Mult 

Add 

Pop Z 哪 


操作 码 长 度 和 所 使 用 的 操作 数 的 数目 肯定 会 影响 到 指令 的 长 度 。 如 果 指 令 的 长 度 固 定 ， 译 码 就 会 
变 得 更 方便 。 但 是 ， 如 果 考 虑 指令 的 向 下 兼容 性 和 灵活 性 ， 操 作 码 的 长 度 有 时 可 能 需要 发 生变 化 。 可 
变 长 度 的 操作 码 存在 着 可 变 长 度 指令 所 遇 到 的 相同 问题 。 许 多 设计 人 员 都 采用 一 种 折衷 的 方案 ， 即 使 
用 扩展 操作 码 。 


5.2.5 扩展 操作 码 


扩展 操作 码 (expanding opcode) 代表 了 一 种 折衷 的 方案 ,就 是 既 要 求 有 尽 可 能 多 的 操作 码 的 数 
目 ， 又 要 求 采用 尽 可 能 短 的 操作 码 ， 所 设计 的 指令 长 度 也 比较 短 。 扩 展 操 作 码 可 以 在 这 两 者 之 间 取 得 
最 佳 平衡 。 其 设计 的 基本 思想 是 : 选用 短 操作 码 ， 而 当 有 需要 时 可 以 有 某 种 方法 将 操作 码 加 长 。 如 果 
使 用 短 的 操作 码 ， 就 留 给 操作 数 大 量 的 指令 位 。 这 也 就 意味 着 每 条 指令 可 以 有 两 个 或 三 个 操作 数 。 如 
果 指 令 不 需要 操作 数 ， 例 如 像 Halt 这 样 的 一 条 指令 ， 或 者 计算 机 使 用 一 个 堆栈 进行 操作 时 ， 指 令 所 
有 的 位 都 可 以 用 作 操 作 码 ， 因 而 可 以 生成 许多 独特 的 指令 。 这 样 一 来 ， 有 些 指令 的 操作 码 比 较 长 ， 但 
操作 数 比较 少 ; 而 有 些 指令 的 操作 码 比 较 短 ， 操 作 数 却 比 较 多 。 

假设 一 台 计算 机 具有 一 个 16 位 的 指令 系统 和 16 个 寄存 器 。 因 为 这 里 使 用 的 是 一 组 寄存 器 而 不 是 
单一 的 累加 器 (就 如 MARIE 机 器 )， 所 以 指令 中 需要 使 用 4 个 二 进 制 位 来 唯一 指定 其 中 的 某 个 寄存 
器 。 因 此 ， 这 里 可 以 编码 产生 16 条 具有 三 个 寄存 器 操作 数 的 指令 ， 也 就 意味 着 任何 要 操作 的 数据 必须 
首先 被 装 人 到 某 个 寄存 器 中 。 或 者 可 以 使 用 指令 中 的 4 位 作为 操作 码 ， 而 剩余 的 12 位 作为 一 个 存储 器 
的 地 址 ， 就 像 MARIE 机 器 中 一 样 〈 假 定 存储 器 的 容 ge - T 
量 为 4KB 字 节 )。 存 储 器 的 访问 需要 占用 12 位 长 度 ， 
只 留 下 4 位 可 以 另 作 他 用 。 但 是 ， 如 果 存 储 器 中 所 有 
数据 都 是 首先 被 装 人 到 寄存 器 组 中 的 某 个 寄存 器 ， 那 
么 指令 可 以 只 使 用 其 中 的 4 位 来 选择 这 些 存放 在 寄存 
器 内 的 特殊 数据 元 素 〈 假 设 有 16 个 寄存 器 ) 。 这 两 种 
选择 方案 如 图 5-2 所 示 。 操作 码 地 址 1 

假设 需要 编码 产生 如 下 指令 : 图 5-2 16 位 指令 格式 的 两 种 可 能 的 形式 
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，15 条 3 地 址 指令 
。14 条 2 地址 的 令 
“31 条 1 地 址 指令 
。16 条 0 地 址 指令 
能 否 只 用 16 位 就 可 以 编码 产生 上 述 的 指令 集 呢 ? 答案 是 肯定 的 ， 只 要 采用 扩展 操作 码 即 可 。 具 体 


编码 方式 如 下 : 

0000 R1 R2 R3 

. 15 3 地 址 编码 
1110 RI1 R2  R3 

1111 0000 RI1 R2 

... | aaaaa 
1111 1101 R1 R2 

1111 1110 0000 R1 

. | wn 
1111 1111 1110 Rl 

1111 1111 1111 0000 

. 16 0 地 址 编码 
1111 1111 1111 1111 


采用 扩展 操作 码 的 方法 使 指令 的 译 码 变 得 更 加 复杂 。 原 因 是 在 译 码 的 过 程 中 ， 不仅 是 检查 指令 中 


各 个 位 的 组 合 形式 以 决定 是 何 种 指令 ， 而 且 需 要 使 用 类 似 于 下 面 的 方式 对 指令 进行 译 码 : 


if (leftmost four bits !l= 1111 ) 【 
Execute appropriate three-address instruction} 
else if (leftmost seven bits != 1111 111 ) { 
Execute appropriate two-address :instructionj} 
else if (leftmost twelve bits != 111l 1111 1111 ) { 
Execute appropriate one-address instruction } 
else { 
Execute appropriate zero-address instruction 


) 
在 上 述 译 码 过 程 的 每 一 个 步 怠 中， 都 需要 有 一 个 备用 的 编码 来 指示 是 否 需 要 检查 更 多 指令 位 。 这 


是 硬件 设计 过 程 中 又 会 遇 到 的 另外 一 种 需要 进行 权衡 折衷 的 例子 : 操作 码 的 长 度 和 操作 数 的 长 度 之 间 
的 均衡 问题 。 


5.3 指令 类 型 
大 多 数 的 计算 机 指令 都 对 数据 执行 操作 ， 但 是 也 有 些 指令 的 操作 对 象 不 是 数据 。 计算 机 制造 商 通 


常 将 指令 归纳 为 以 下 几 种 类 型 : 


。 数 据 移动 

。 算术 运算 

“布尔 逻辑 运算 

。 位 操作 〈 移 位 和 循环 换 位 ) 
“输入 /输出 (1/O) 

。 控制 转移 。 
。 专 门 用 途 
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数据 移动 指令 是 最 常用 的 指令 。 人 们 常常 需要 将 数据 从 存储 器 移 到 寄存 器 ， 从 寄存 器 移 到 寄存 器 ， 
以 及 从 寄存 器 移 到 存储 器 等 。 许 多 计算 机 都 有 多 种 不 同 的 数据 移动 指令 ， 其 具体 应 用 取决 于 数据 来 源 
和 移动 目的 。 例 如 ， 指 令 MOVER 要 求 有 两 个 寄存 器 操作 数 ， 而 指令 MOVE 却 是 使 用 一 个 寄存 器 操作 数 
和 一 个 存储 器 操作 数 。 某 些 计 算 机 体系 结构 ， 例 如 RISC 结构 ， 会 限制 将 数据 从 存储 器 移出 或 将 数据 
移 到 存储 器 的 指令 ， 以 加 快 系统 运行 速度 。 许 多 计算 机 中 有 多 种 载 人 (load) 、 存 储 〈store) 和 移动 
(move) 指令 来 处 理 不 同 大 小 的 数据 。 例 如 ， 某 些 机 器 可 能 会 设计 LOADB 指令 来 处 理 各 种 字 节 数据 ， 
而 采用 LOADW 指令 来 处 理 计算 机 的 数据 字 。 

算术 运算 指令 包括 有 整数 和 浮 点 运算 的 各 种 指令 。 许 多 机 器 还 对 不 同 大 小 的 数据 提供 有 不 同 的 算 
术 运 算 指 令 。 与 数据 移动 指令 一 样 ， 有 时 计算 机 也 会 为 用 户 设计 多 种 不 同 的 算术 运算 指令 ， 以 满足 操 
作 数 为 寄存 器 和 以 不 同 寻 址 方式 访问 存储 器 的 各 种 组 合 方式 的 需求 。 

布尔 逻辑 指令 执行 布尔 逻辑 运算 ， 与 算术 指令 的 运算 方式 非常 类 似 。 通 常 ， 逻 辑 运算 指令 执行 的 
是 逻辑 与 (AND) 、 逻 辑 非 (NOT) 、 逻 辑 或 〈(OR) 和 异 或 〈XOR) 等 运算 。 

位 操作 指令 用 来 在 某 个 特定 的 数据 字 中 对 一 些 单独 数据 位 〈 或 者 是 一 些 位 的 集合 ) 进行 置 位 和 复 
位 操作 。 位 操作 指令 包括 了 各 种 算术 移 位 指令 、 逻 辑 移 位 指令 和 循环 移 位 指令 ， 这 些 移 位 操作 既 可 以 
向 左 进行 ， 也 可 以 向 右 进行 。 逻 辑 移 位 指令 简单 地 执行 将 二 进 制 数 左 移 或 右 移 规 定 的 位 数 ， 而 在 移 位 
的 反方 向 将 对 应 数目 的 0 移 进 来 。 算 术 移 位 指令 通常 用 来 对 二 进 制 数 进行 乘 以 2 或 除 以 2 的 操作 ， 但 
并 不 移动 最 左边 的 位 ， 因 为 最 左边 的 位 通常 表示 的 是 数字 的 符号 。 对 于 算术 右 移 操 作 ， 符 号 位 将 会 被 
复制 到 其 右边 的 位 置 上 。 对 于 算术 左 移 操作 ， 数 值 向 左 移 位 ， 而 将 0 移 进来 ， 但 是 符号 位 不 能 移动 。 
循环 移 位 指令 只 是 简单 地 执行 将 移出 的 各 个 位 在 相反 方向 依次 移 进 来 。 例 如 ， 对 于 循环 左 移 1 位 的 操 
作 ， 结 果 是 数据 字 的 各 个 位 依次 左 移 一 位 ， 而 最 左边 的 一 位 被 移出 ， 循 环 后 变 成 了 最 右边 的 一 位 。 

输入 /输出 (1/O) 指令 随 着 计算 机 体系 结构 的 不 同 而 有 很 大 区 别 。 处 理 输入 输出 的 基本 方式 有 : 程序 
控制 的 WO、 中 断 驱 动 的 1/O 和 直接 存储 器 访问 (DMA) 的 1/0 三 种 方式 。 这些 内 容 将 在 第 ?7 章 详细 介绍 。 

控制 指令 包括 分 支 转移 (branch) 、 跳 过 〈skip) 和 进程 调用 (procedure call) 等 。 分 支 转移 分 为 
条 件 转移 和 无 条 件 转移 。 跳 过 指令 实际 上 是 没有 指定 地 址 的 分 支 转 移 指令 。 因 为 不 需要 操作 数 ， 跳 过 
指令 通常 使 用 地 址 域 的 二 进 制 位 来 指定 一 些 不 同 的 环境 (读者 可 以 回忆 MARIE 中 使 用 的 Skipcond 
指令 )。 进 程 调用 是 一 些 特殊 的 分 支 转移 指令 ,它们 会 自动 存储 程序 返回 的 地 址 。 不 同 的 机 器 可 能 会 采 
用 不 同 的 方法 存储 这 个 返回 地 址 。 有 些 机 器 将 这 个 返回 地 址 存放 在 存储 器 的 某 个 特定 的 存储 单元 内 ， 
有 些 机 器 把 地 址 存放 在 某 个 寄存 器 中 ， 而 其 他 的 一 些 机 器 则 把 返回 地 址 压 人 到 一 个 堆栈 中 。 至 此 ， 读 
者 已 经 了 解 了 堆栈 还 可 以 用 作 其 他 目的 。 

专用 指令 包括 字符 串 处 理 的 指令 、 高 级 语言 支持 的 指令 、 保 护 和 标志 位 控制 指令 ， 以 及 高 速 缓存 
(cache) 指令 等 。 大 部 分 计算 机 体系 结构 都 提供 字符 串 处 理 的 指令 ， 其 中 包括 字符 串 操 作 和 搜索 。 


5.4 寻 址 


虽然 寻 址 是 一 个 指令 设计 问题 ， 而 且 从 技术 上 来 说 它 是 指令 格式 的 一 部 分 ， 但 是 由 于 寻 址 涉及 到 
许多 方面 的 问题 ， 所 以 这 里 将 寻 址 这 个 问题 单独 列 出 来 讨论 。 与 寻 址 有 关 的 两 个 最 重要 的 问题 是 : 可 
以 进行 编 址 的 数据 类 型 和 各 种 各 样 的 寻 址 方式 。 这 里 只 介绍 一 些 最 基本 的 寻 址 方式 ， 利 用 这 些 基本 的 
寻 址 方式 可 以 构建 一 些 比较 复杂 的 特殊 寻 址 方式 。 


5.4.1 数据 类 型 


在 讨论 如 何 对 数据 进行 编 址 前 ， 先 来 简单 介绍 一 下 指令 可 以 访问 的 各 种 数据 类 型 。 如 果 指 令 要 引 
用 某 个 特定 的 数据 类 型 ， 必 须 有 相应 的 硬件 对 该 种 类 型 的 数据 提供 支持 。 第 2 章 讨 论 了 各 种 不 同 的 数 
据 类 型 ， 包 括 数字 和 字符 。 数 字数 据 由 整数 数值 和 浮 点 数值 组 成 。 整 数 可 以 分 为 带 符号 整数 和 无 符号 
整数 ， 并 且 可 以 声明 为 不 同 长 度 的 整数 。 例 如 ， 在 C++ 语言 设计 中 ， 整 数 可 以 是 短 〈short) 整数 〈16 
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位 )、 整 数 〈int) 〈 即 特定 体系 结构 的 机 器 字 长 度 ) 或 长 〈long) 整数 (32 位 )。 而 浮 点 数值 的 长 度 可 以 
是 32 位 、64 位 或 128 位 。 正 如 前 面 所 述 ， 计 算 机 的 指令 系统 中 常 有 一 些 特殊 指令 ， 可 以 用 来 处 理 可 变 
长 度 的 数字 数据 。 例 如 ， 指 令 系 统 中 可 能 会 有 一 条 MOVE 指令 处 理 16 位 整数 ， 而 使 用 另外 一 条 不 同 的 
MOVE 来 处 理 32 位 整数 。 

非 数 字数 据 包 括 字 符 串 、 布 尔 数值 和 指针 。 字 符 串 指令 一 般 有 复制 、 移 动 、 搜 索 或 修改 等 操作 。 
布尔 逻辑 操作 包括 AND (逻辑 与 )、OR (逻辑 或 )、XOR ( 异 或 ) 和 NOT (逻辑 非 ) 等 操作 。 指 针 实 
际 上 就 是 存储 器 中 的 存储 单元 的 地 址 。 尽 管 从 本 质 上 来 说 ， 它 们 都 是 一 些 数字 ， 但 是 指针 还 是 被 认为 
是 与 整数 和 浮 点 数字 不 同 的 数据 类 型 。MARIE 采用 直接 寻 址 方式 来 处 理 指 针 这 种 数据 类 型 。 指 令 系 
统 中 采用 这 种 方式 的 操作 数 实际 上 都 是 指针 。 对 于 使 用 指针 的 指令 ， 操 作 数 本 质 上 就 是 一 个 地 址 ， 并 
且 必 须 被 当成 一 个 地 址 处 理 。 


5.4.2 和 寻 址 方式 


在 第 4 章 中 ，MARIE 的 指令 有 一 个 12 位 的 操作 数 域 。 这 个 操作 数 可 以 按 两 种 方式 来 解释 ， 12 位 的 
二 进 制 数 可 以 表示 操作 数 的 存储 器 地 址 ， 也 可 以 是 一 个 指示 物理 存储 器 地 址 的 指针 。 实 际 上 还 可 以 解释 
成 其 他 不 同 的 内 容 ， 这 样 就 可 以 形成 几 种 不 同 的 寻 址 方式 〈addressing mode) 。 寻 址 方式 是 指定 指令 中 操 
作 数 的 位 置 的 方法 。 一 种 寻 址 方式 所 指定 的 内 容 可 以 是 一 个 常数 、 一 个 寄存 器 或 是 存储 器 中 的 一 个 存储 单 
元 。 某 些 寻 址 方式 可 以 使 用 较 短 的 地 址 ， 而 有 些 寻 址 方式 指出 的 就 是 实际 操作 数 的 位 置 。 从 动态 的 角度 来 
看 ， 实 际 操作 数 的 位 置 称 为 操作 数 的 有 效 地 址 (effective address)。 下 面 讨 论 几 种 最 基本 的 寻 址 方式 。 





立即 寻 址 (immediate addressing) 是 指 在 指令 中 操作 代码 后 面 的 数值 会 被 立即 引用 。 也 就 是 说 ， 
要 操作 的 数据 本 身 是 指令 的 一 部 分 。 例 如 ， 如 果 操 作 数 的 寻 址 方式 是 立即 寻 址 ， 指 令 Load 008 的 操作 
就 是 将 数值 8 直接 装 人 累加 器 AC 中 。 这 里 ，12 位 的 操作 数 域 并 不 是 指定 一 个 地 址 ， 而 是 表示 指令 所 
要 求 的 实际 操作 数 。 立 即 寻 址 方式 的 执行 速度 非常 快 ， 因 为 要 加 载 的 数值 就 包含 在 指令 中 。 但是， 由 
于 编译 时 要 加 载 的 数值 是 固定 的 ， 所 以 这 种 寻 址 方式 非常 不 灵活 。 





直接 寻 址 〈direct addressing) 是 指 在 指令 中 直接 指定 要 引用 的 数值 的 存储 器 地 址 。 例 如 ， 如 果 操 
作 数 的 寻 址 方式 是 直接 寻 址 ， 指 令 Load 008 的 操作 就 是 将 存储 器 地 址 为 008 的 存储 单元 中 的 数值 装 人 
累加 器 AC 中 。 直 接 寻 址 方式 的 操作 也 很 快 ， 因 为 尽管 要 加 载 的 数值 并 不 包含 在 指令 中 ， 但 是 这 种 直 
接 的 地 址 访问 非常 快 。 直 接 寻 址 方式 比 立 即 寻 址 方式 要 灵活 得 多 ， 因 为 要 加 载 的 数值 是 存放 在 给 定 地 
址 的 存储 单元 中 ， 这 个 数值 是 可 变 的 。 





合生 壤 汪 址 

在 寄存 器 寻 址 (register addressing) 方式 中 ， 是 采用 一 个 寄存 器 ， 而 不 是 存储 器 来 指定 操作 数 。 
这 种 方式 与 直接 寻 址 方式 非常 类 似 ， 所 不 同 的 只 是 指令 的 地 址 域 包含 的 是 一 个 寄存 器 的 引用 ， 而 不 是 
某 个 存储 器 的 地 址 。 寄 存 器 寻 址 方式 中 被 指定 的 寄存 器 中 的 内 容 将 用 作 指 令 的 操作 数 。 





间接 娃 引 (indirect addressing) 是 一 种 非常 有 效 的 寻 址 方式 ， 使 用 起 来 特别 灵活 。 在 间接 寻 址 方 
式 中 ， 地 址 域 中 的 二 进 制 数 用 来 指定 一 个 存储 器 地 址 ， 该 地 址 中 的 内 容 将 被 用 作 一 个 指针 。 操 作 数 的 
有 效 地 址 是 通过 访问 这 个 存储 器 地 址 来 获取 的 。 例 如 ， 如 果 操 作 数 的 寻 址 方式 是 间接 寻 址 ， 指 令 Load 
008 的 操作 表示 在 存储 器 地 址 为 008 的 单元 中 存放 的 数据 值 实际 上 就 是 所 要 求 的 操作 数 的 有 效 地 址 。 
假设 在 008 单元 存放 的 数值 为 2A0。 那 么 2A0 就 是 需要 读 取 数值 的 真实 地 址 。 执 行 这 条 指令 的 操作 之 
后 就 将 地 址 为 2A0 的 存储 器 单元 中 的 内 容 装 人 到 累加 器 AC 中 。 

作为 间接 寻 址 方式 的 一 种 变化 形式 ， 操 作 数 域 的 二 进 制 位 也 可 以 用 来 指定 一 个 寄存 器 ， 而 不 是 指定 某 
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个 存储 器 地 址 。 这 种 方式 称 为 寄存 器 间接 寻 址 (register indirect addressing)， 除了 采用 一 个 寄存 器 来 代替 某 
个 存储 器 地 址 作为 指针 外 ， 寄 存 器 间接 寻 址 的 工作 原理 与 间接 寻 址 方式 完全 相同 。 例 如 ， 如 果 指 令 是 Load 
R1， 并 且 采 用 的 是 寄存 器 间接 寻 址 方式 ， 那 么 指令 可 以 在 寄存 器 Rl 中 找到 所 需要 的 操作 数 的 有 效 地 址 。 





在 变 址 寻 址 方式 〈indexed addressing) 中 ， 一 个 变 址 寄存 器 (要么 显 式 地 指定 ， 要 么 隐 式 指定 ) 
用 来 存储 一 个 偏 移 量 〈offset) ， 或 称 为 位 移 量 (displacement)。 将 这 个 偏 移 量 与 操作 数 相 加 ， 就 产生 
了 指令 所 要 求 的 数据 的 有 效 地 址 。 例 如 ， 如 果 指 令 Load x 中 的 操作 数 X 是 采用 变 址 寻 址 方式 编 址 的 。 
若 假定 R1 为 变 址 寄存 器 ， 而 且 其 中 存放 的 数值 为 1， 那么 操作 数 的 有 效 地 址 实际 上 就 是 X 十 1。 基 址 
寻 址 (based addressing) 方式 与 变 址 寻 址 方式 非 党 类似。 他 们 的 区 别 是 ， 基 址 寻 址 方式 使 用 的 是 基地 
址 寄存 器 ， 而 不 是 变 址 寄存 器 。 从 理论 上 来 说 ， 这 两 种 方式 的 差别 是 如 何 使 用 这 两 种 寻 址 方式 ， 而 不 
是 如 何 计算 操作 数 。 一 个 变 址 寄存 器 保存 的 是 一 个 变 址 〈 或 称 为 索引 ，index) ， 这 个 变 址 将 会 用 作 一 
个 相对 于 指令 地 址 域 所 给 出 地 址 的 偏 移 量 。 基 址 寄存 器 保存 的 是 一 个 基地 址 ， 而 对 应 的 指令 地 址 域 中 
的 内 容 所 表示 的 则 是 偏离 该 基地 址 的 位 移 量 。 这 两 种 寻 址 方式 在 访问 数组 元 素 和 字符 串 中 的 字符 时 ， 
都 是 非常 有 用 的 。 事实 上 ， 大 部 分 的 汇编 语言 都 提供 有 专用 的 变 址 寄存 器 ,许多 的 字符 串 操 作 指 令 中 
都 包含 这 类 变 址 寄存 器 。 如 果 对 指令 系统 进行 专门 的 设计 ， 通 用 寄存 器 也 可 以 在 这 种 寻 址 方式 中 使 用 。 

如 果 使 用 堆栈 寻 址 (stack addressing) 方式 ， 则 操作 数 就 假定 放 在 堆栈 中 。 在 第 5. 2.4 节 ， 读 者 
已 经 了 解 这 种 寻 址 方式 的 工作 原理 。 





基于 上 述 各 种 最 基本 的 寻 址 方式 ， 还 可 以 生成 许多 变化 。 例 如 ， 有 些 机 器 有 间接 变 址 寻 址 (indi- 
rect indexed addressing) 方式 ， 即 同时 采用 间接 寻 址 和 变 址 寻 址 。 又 如 ， 基 址 / 偏 移 量 寻 址 (base/off- 
set addressing) 方式 ， 是 先 将 一 个 偏 移 量 加 到 某 个 特定 的 基 址 寄存 器 中 ， 然 后 再 与 指定 的 操作 数 相 加 ， 
产生 指令 所 使 用 的 实际 操作 数 的 有 效 地 址 。 还 有 自动 增 量 (auto-increment) 寻 址 方式 和 自动 减 量 
(auto-decrement) 寻 址 方式 ， 可 以 对 所 使 用 的 地 址 寄存 器 中 的 内 容 进行 自动 增 量 或 减 量 操作 。 使 用 这 
种 寻 址 方式 的 优点 是 可 以 减 小 编码 的 长 度 。 这 种 寻 址 方式 在 某 些 应 用 程序 中 〈 例 如 嵌入 式 系统 ) 至 关 
重要 。 而 自 相 对 寻 址 (self-relative addressing) 方式 ， 则 是 从 当前 指令 获取 偏 移 量 ， 通 过 计算 获得 下 
一 条 指令 的 操作 数 的 地 址 。 当 然 ， 还 有 其 他 寻 址 方式 。 但 是 ， 熟 悉 掌 握 了 立即 寻 址 、 直 接 寻 址 、 寄 存 
器 寻 址 、 间 接 寻 址 、 变 址 寻 址 和 堆栈 寻 址 方式 等 这 些 基 本 概念 ， 有 助 于 理解 其 他 的 各 种 寻 址 方式 。 

举例 说 明 这 些 不 同 的 寻 址 方式 。 假 设 指令 Load 800、 存 储 器 和 寄存 器 R1 的 安排 如 图 5-3 所 示 。 

对 指令 中 包含 数值 800 的 操作 数 域 应 用 不 同 的 寻 址 方式 。 并 且 假 定 寄存 器 R1 隐 含 在 变 址 寻 址 方式 
中 ， 表 5-1 给 出 了 实际 装 人 累加 器 AC 的 数值 。 


存储 器 


表 5-1 5-2 采用 不 同 的 寻 址 方式 获取 
的 指令 执行 结果 
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图 5-3 执行 指令 Load 800 时 ， 
存储 器 单元 中 的 内 容 
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如 果 使 用 的 是 寄存 器 寻 址 方式 ， 指 令 Load R1 将 则 数值 800 装 人 到 累加 器 中 。 如 果 使 用 寄存 器 间 
接 寻 址 方式 ， 指 令 Load R1 则 是 将 数值 900 装 人 累加 器 中 。 

表 5-2 总 结 了 各 种 不 同 的 寻 址 方式 。 表 5-2 基本 寻 址 方式 汇总 

利用 各 种 不 同 的 寻 址 方式 ， 可 以 极 大 地 : 具 数 的 方 
扩大 操作 数 的 寻 址 范围 。 指 令 系统 的 设计 不 
应 该 只 限于 一 种 或 两 种 寻 址 方式 。 当 然 ， 任 
何 的 设计 都 需要 均衡 考虑 。 有 时 ， 我 们 牺牲 
地 址 计算 的 简便 性 和 有 限 的 内 存 引用 以 换取 















作 数 的 值 直接 包含 在 指令 中 
指令 的 地 址 域 就 是 操作 数 的 有 效 地 址 
操作 数 的 数值 存放 在 寄存 器 中 


立即 寻 址 




























灵活 性 和 更 大 的 寻 址 范围 。 间接 寻 址 地 址 域 指向 实际 操作 数 的 地 址 
寄存 器 间接 寻 址 寄存 器 包含 实际 操作 数 的 地 址 
5.5 指令 流水 线 ES 
恋 址 寻 址 或 基 址 寻 址 地 址 域 的 数值 与 寄存 器 中 的 
至 此 ， 读 者 已 经 熟悉 了 第 4 章 介 绍 的 计 内 容 相 加 产生 操作 数 的 有 效 地 址 





算 机 的 取 指 - 译 码 -执行 的 周期 循环 过 程 。 从 堆栈 寻 址 操作 数位 于 堆栈 中 
概念 上 来 说 ， 计 算 机 使 用 时 钟 脉 冲 来 精确 控 
制 各 个 操作 步骤 的 顺序 执行 。 但 是 ， 有 时 还 可 以 使 用 一 些 额 外 的 脉冲 来 控制 某 个 操作 步骤 中 的 一 些 较 
小 细节 。 有 些 CPU 会 将 取 指 - 译 码 -执行 周期 分 成 一 些 较 小 的 步骤 ， 其 中 的 某 些 较 小 的 步骤 可 以 并 行 执 
行 。 这 种 时 间 上 的 交 释 可 以 加 快 CPU 的 执行 速度 。 这 种 方法 称 为 流水 线 (pipeline)， 现 在 所 有 的 CPU 
都 采用 该 方法 。 

现在 ， 假 设 将 计算 机 的 取 指 - 译 码 -执行 周期 分 解 成 如 下 小 步骤 〈mini-step) : 

1. 取 指 令 
2. 操作 码 译 码 
3. 计算 操作 数 的 有 效 地 址 
4. 取 操 作 数 
5 
6 





. 执行 指令 

. 存储 结果 

计算 机 的 流水 线 概念 与 汽车 组 装 生产 线 非常 相似 。 计 算 机 流水 线 中 的 每 个 步骤 完成 指令 的 一 部 分 
功能 。 如 同 汽车 组 装 生产 线 一 样 ， 不 同 的 步骤 可 以 并 行 完 成 不 同 指令 的 各 个 部 分 。 这 其 中 的 每 一 个 步 
又 都 称 为 流水 线 级 (pipeline stage) 。 将 流水 线 逐 级 连接 起 来 ， 就 构成 了 一 条 指令 执行 的 管道 。 指 令 从 
流水 线 管道 的 一 端 进 入 ， 通 过 不 同 级 的 流水 线 作 业 ， 最 后 从 管道 的 另 一 端 出 来 。 流 水 线 分 级 的 目的 是 
要 对 通过 流水 线 的 每 一 级 所 花费 的 时 间 进行 均衡 控制 ， 也 就 是 要 使 经 过 每 级 流水 线 所 花 的 时 间 基 本 上 
一 致 。 如 果 流 水 线 不 能 在 时 间 上 取得 平衡 ， 那 么 会 发 生 较 快 的 流水 线 级 需要 等 待 较 慢 的 流水 线 级 的 情 
况 。 这 里 ， 举 现实 生活 中 的 一 个 例子 来 说 明 这 种 不 平衡 带 来 的 影响 。 下 面 考虑 洗衣 过 程 的 分 级 管理 。 
如 果 只 有 一 个 洗衣 机 和 一 个 干 衣 机 ， 常 常会 发 生 洗衣 完成 后 ， 等 待 干 衣 的 情形 。 如 果 将 洗衣 看 作 是 过 
程 的 第 一 级 ， 而 将 干 衣 当 作 第 二 级 ， 不 难看 到 需要 花费 较 长 时 间 的 干 衣 过 程 会 造成 衣物 在 两 级 之 间 发 
生 堆 积 。 如 果 再 加 入 折 秋 衣物 作为 洗衣 过 程 的 第 三 级 ， 那 么 人 们 很 快 就 会 意识 到 这 一 级 总 是 需要 等 待 
其 他 的 一 个 比较 慢 的 级 。 

图 5-4 说 明了 一 个 具有 重 春 级 的 计算 机 流水 线 过 程 。 图 中 清楚 地 标明 了 每 条 指令 执行 过 程 中 的 每 
个 时 钟 周 期 和 每 二 级 流水 线 。 这 里 ，S1 表示 取 指令 ，S2 表示 译 码 ，S3 表示 计算 操作 ，S4 表示 取 操 作 
数 ，S5 表示 执行 指令 ，S6 表示 存储 结果 。 

从 图 54 可 以 看 出 ， 一 旦 第 一 条 指令 的 取 指 任务 完成 ， 第 一 条 指令 就 会 被 送 去 进行 译 码 操 作 。 与 
此 同时 ， 可 以 开始 第 二 条 指令 的 取 指 。 当 第 一 条 指令 取 操作 数 时 ， 第 二 条 指令 被 送 去 译 码 ， 同 时 开始 
取 第 三 条 指令 。 注 意 ， 这 些 事件 可 以 并 行 发 生 ， 就 像 汽车 装配 生产 线 。 

假设 有 一 个 上 级 流水 线 ， 时 钟 周期 时 间 为 i。 ， 即 每 级 流水 线 需 要 tp 时 间 。 并 假定 有 nn 条 指令 ( 通 
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图 5-4 4 条 指令 经 过 6 级 流水 线 的 过 程 
常 称 为 个 任务 ，task) 需要 处 理 。 任 务 1 (Ti ) 需要 kXtp 时 间 才 能 完成 。 剩 下 的 n 一 1 个 任务 每 隔 
一 个 时 钟 周期 就 从 流水 线 中 出 来 一 个 ， 也 就 是 说 剩 下 的 这 些 任 务 需要 的 总 时 间 为 (n 一 1) tp。 因 此 ， 


利用 级 流水 线 完 成 n 任务 需要 的 时 间 为 : 
(kXtp)t nm—1)t, 一 (& 十 于 一 1)tp 
或 者 为 & 十 (n 一 1) 个 时 钟 周期 。 
现在 我 们 来 计算 使 用 流水 线 后 所 获得 的 速度 上 的 提升 ， 称 为 加 速 比 (speedup)。 没 有 流水 线 ， 执 
行 n 条 指令 共 需 要 nt 个 周期 其 中 声 二 kXtp。 所 以 ， 获 得 的 加 速 比 (定义 为 没有 使 用 流水 线 的 时 间 
除 以 使 用 流水 线 后 的 时 间 〉 为 : 





nitn 
(k 十 n 一 1)ip 


如 果 取 ” 趋 于 无 限 大 的 极限 条 件 ， 可 以 看 出 (k 十 n 一 1) 趋 于 n ,这样 就 得 到 了 一 个 理论 上 的 加 
速 比 结果 : 


We 





理论 上 的 加 速 比 就 是 流水 线 的 级 数 。 

下 面 举 一 个 例子 。 假 设 有 一 个 4 级 流水 线 。 其 中 : 

*Sl 三 取 指令 

。S2 = 译 码 和 计算 有 效 地 址 

。S3 三 取 操 作 数 

。S4 三 执行 指令 和 存储 结果 

这 里 必须 假定 该 体系 结构 还 提供 了 一 种 可 以 并 行 提取 数据 和 指令 的 方法 。 当 然 ， 只 需 采 用 两 条 独 
立 的 指令 通路 和 数据 通路 可 以 做 到 这 一 点 。 但 是 ， 事 实 上 大 部 分 存储 器 系统 都 不 这 样 做 ， 而 是 把 操作 
数 存 放 在 高 速 缓存 中 。 这 样 ， 在 大 多 数 情况 下 ， 取 指令 和 取 操 作 数 可 以 同时 进行 。 这 里 ， 还 假定 指令 
I3 是 一 个 条 件 分 支 转移 语句 。 这 个 分 支 转移 指令 会 改变 指令 执行 的 顺序 。 即 机 器 不 再 执行 紧 跟 I3 后 面 
的 指令 4， 而 是 将 CPU 控制 转移 去 执行 指令 18。 这 种 流水 线 操作 的 结果 如 图 5-5 所 示 。 

从 图 中 可 见 ， 机 器 对 指令 4、I5 和 16 都 进行 了 取 指 和 接 下 来 的 各 种 操作 。 但 是 ， 在 执行 指令 13 
(分 支 转移 指令 ) 后 ， 不 再 需要 指令 4、I5 和 I6。 只 有 在 第 6 个 时 钟 周 期 后 ， 也 就 是 指令 I3 执行 完毕 
后 ， 才 对 下 一 条 可 以 执行 的 指令 “〈I8) 进行 取 指 操作 。 这 时 ， 流 水 线 的 管道 才 会 重新 装 满 指令 。 从 第 6 


148 第 5 章 





个 时 钟 周期 到 第 9 个 时 钟 周期 ， 只 有 一 条 指令 被 执行 。 理 想 的 情况 下 ， 一旦 流水 线 管道 开始 装 人 指令 
后 ， 每 个 时 钟 周 期 都 应 该 有 一 条 指令 从 流水 线 中 流出 。 但 是 ， 上 面 的 这 个 例子 说 明 情况 并 非 总 是 如 此 。 


: 痢 


EA 

Ee 
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图 5-5 带 条 件 分 支 转移 的 指令 流水 线 的 例子 

值得 注意 的 是 ， 并 不 是 所 有 指令 都 必须 经 过 管道 中 的 每 一 级 流水 线 。 如 果 一 条 指令 没有 操作 数 ， 
就 没有 必要 经 过 第 3 级 流水 线 。 为 了 简化 流水 线 的 硬件 设计 和 定时 的 时 序 问题 规定 所 有 的 指令 都 必 
须 经 过 流水 线 的 每 一 级 ， 而 不 管 指令 是 否 需要 这 样 做 。 

通过 前 面 有 关 加 速 比 的 讨论 ， 读 者 也 许 会 觉得 流水 线 的 级 数 越 多 ,计算机 运行 的 速度 就 越 快 。 从 
某 种 意义 上 来 说 ， 这 一 点 是 对 的 。 将 数据 从 存储 器 移动 到 寄存 器 涉及 固定 的 开销 。 流 水 线 的 控制 逻辑 
的 数量 和 大 小 也 会 与 流水 线 级 数 的 增加 成 正比 。 这 无 疑 会 减 慢 系统 总 的 执行 速度 。 另外， 还 存在 下 面 
几 种 条 件 会 导致 “流水 线 冲突 (pipeline conflict)”， 这 些 情况 会 阻碍 计算 机 实现 每 个 时 钟 周期 执行 一 条 
指令 的 目标 。 这 些 条 件 包括 : 

“资源 冲突 

* 数据 关联 

。 条件 分 支 语句 

资源 冲突 (resource conflict) 是 指令 级 并 行 执行 过 程 中 要 考虑 的 主要 问题 。 例 如 ， 如 果 计 算 机 要 
将 某 个 数值 存放 到 存储 器 中 ， 同 时 又 正在 从 存储 器 中 提取 另 一 条 指令 ， 这 两 个 操作 都 需要 访问 内 存 。 
通常 ， 解 决 这 种 冲突 的 办 法 是 让 存储 指令 继续 执行 ， 而 强制 让 取 指 的 指令 等 待 。 当 然 ， 某 些 冲突 也 可 
以 通过 使 用 两 条 独立 的 通道 来 加 以 解决 : 一 条 通道 用 于 从 内 存 中 取 数 据 ， 而 另 一 条 通道 用 于 从 内 存 中 
取 指 令 。 

数据 关联 (data dependency) 是 指 当 一 条 指令 的 执行 尚未 结束 时 ， 后 面 某 条 指令 却 要 求 该 指令 的 
执行 结果 作为 其 操作 数 。 处 理 这 种 类 型 的 流水 线 冲突 有 几 种 方法 。 技 术 上 可 以 添加 专门 的 硬件 来 检测 
某 条 指令 的 源 操作 数 是 否 是 流水 线 上 游 的 指令 的 目标 操作 数 。 这 种 硬件 通过 在 流水 线 中 插 人 一 个 简短 
的 延迟 (通常 是 加 入 一 条 不 执行 操作 的 no-op 指令 )， 让 计算 机 有 足够 的 时 间 来 解决 这 种 冲突 。 同 样 ， 
也 可 以 利用 专门 的 硬件 来 检测 这 类 冲突 ， 并 且 引 导数 据 经 过 存在 于 流水 线 各 级 之 间 的 某 些 特殊 通道 。 
这 样 就 可 以 减少 指令 访问 其 操作 数 所 需要 的 时 间 。 有 些 计算 机 体系 结构 采用 编译 器 来 解决 这 种 冲突 。 
特殊 设计 的 编译 器 可 以 对 各 种 指令 进行 重新 排序 ， 在 装 入 任何 存在 冲突 的 数据 时 都 会 产生 一 个 短暂 的 
延迟 ， 而 不 会 对 程序 的 逻辑 和 结果 产生 任何 影响 。 

程序 员 可 以 使 用 分 支 转移 语句 来 改变 程序 的 执行 流程 。 但 是 这 样 会 对 流水 线 造成 重大 问题 。 如 果 
每 个 时 钟 周期 提取 一 条 指令 ， 则 可 能 会 在 前 面 的 某 条 分 支 转移 指令 之 前 ,已 经 提取 好 几 条 指令 ， 甚 至 
可 能 完成 了 译 码 操作 。 计 算 机 处 理 这 类 条 件 分 支 语句 非常 困难 。 许 多 计算 机 体系 结构 都 设计 分 支 预测 
(branch prediction) 机 构 ， 利 用 合理 的 逻辑 来 对 下 一 条 指令 做 出 最 优 的 预测 。 从 本 质 上 来 说 ， 分 支 预 
测 结构 主要 是 预测 条 件 分 支 转 移 的 结果 。 编 译 器 试图 通过 重新 安排 机 器 代码 的 方式 来 产生 一 个 延迟 的 
分 支 转移 (delayed branch) 操作 ， 以 解决 分 支 问题 。 另 一 种 解决 分 支 转移 的 问题 是 对 程序 进行 重新 排 
序 ， 并 且 在 程序 中 插入 一 些 有 用 的 指令 。 如 果 无 法 插入 有 用 的 指令 ， 可 以 插 和 一些 no-op 指令 ， 以 保 
持 流 水 线 始终 处 于 充满 的 状态 。 某 些 计算 机 采用 的 另外 一 种 解决 方案 是 对 某 个 已 知 的 条 件 分 支 转移 的 
两 条 分 支 通道 都 开始 执行 取 指 操作 ， 并 将 这 些 结果 存储 起 来 ， 等 待 这 条 分 支 语句 的 实际 执行 。 当 这 条 
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分 支 语 句 真 正 执行 时 ， 需 要 执行 的 “真实 ”的 分 支 路 径 实 际 上 就 已 经 知道 了 。 

为 了 提高 芯片 硬件 的 工作 性 能 ， 现 代 的 CPU 系统 都 采用 了 超标 量 设 计 (参见 第 4 章 )， 这 是 除 流 
水 线 外 的 男 一 种 新 技术 。 超 标量 设计 的 芯片 具有 多 个 ALU 执行 单元 ， 每 个 时 钟 周期 可 以 流出 一 条 以 
上 的 指令 。 因 此 ， 每 条 指令 的 执行 时 间 实 际 上 可 以 降 到 一 个 时 钟 周 期 以 下 。 但 是 所 带 来 的 风险 是 使 得 
程序 的 逻辑 变 得 更 加 复杂 。 与 程序 的 真正 执行 过 程 相 比 ， 超 标量 芯片 需要 设计 更 多 逻辑 过 程 来 预先 安 
排 各 种 操作 。 即 使 采用 了 非常 复杂 的 逻辑 过 程 ， 也 很 难 预先 安排 好 动态 的 〈on the fly) 并 行 操作 。 

由 于 这 种 动态 时 序 安排 存在 的 各 种 限制 ， 计 算 机 设计 人 员 开 始 考虑 一 种 完全 不 同 的 体系 结构 ， 显 
式 并 行 指令 计算 机 (EPIC)， 读 者 可 以 参阅 第 4 章 所 讨论 的 有 关 Itanium 计算 机 的 例子 。EPIC 采用 非 
常 大 的 指令 (例如 Itanium 的 指令 为 128 位 指令 )， 该 指令 可 以 规定 几 个 需要 并 行 执行 的 操作 。 由 于 这 
种 并 行 特 征 是 CPU 设计 中 的 固有 特性 ， 所 以 EPIC 的 指令 系统 强烈 地 取决 于 编译 器 (这 意味 着 用 户 需 
要 有 一 个 非常 复杂 精巧 的 编译 器 来 利用 并 行 特 征 以 获取 机 器 性 能 上 的 最 大 优势 )。 安 排 操作 的 负担 从 处 
理 器 转移 到 编译 器 。 这 样 ， 人 们 可 以 利用 更 多 的 时 间 来 开发 一 种 好 的 时 序 和 分 析 可 能 的 流水 线 冲 突 。 

为 了 减少 由 于 条 件 分 支 转移 造成 的 流水 线 问题 ，IA-64 的 体系 结构 引入 了 断定 (predicated) 指令 。 
利用 比较 指令 设置 断定 位 ， 就 像 在 x86 系列 CPU 中 设置 条 件 代 码 一 样 ， 区 别 是 这 里 有 64 个 断定 位 。 
对 应 于 每 个 操作 都 规定 了 一 个 断定 位 。 只 有 当 断 定位 等 于 1 时 ， 才 执行 该 操作 。 事 实 上 ， 所 有 的 操作 
指令 都 会 执行 。 但 是 ， 只 将 断定 位 为 1 的 操作 结果 存储 到 寄存 器 文件 中 。 这 样 做 的 结果 是 ， 需 要 执行 
更 多 指令 ,但 是 不 会 发 生 为 了 等 待 某 个 条 件 而 造成 的 流水 线 阻塞 冲突 。 

并 行 执行 有 几 种 级 别 ， 可 以 执行 从 简单 到 复杂 的 并 行 操作 。 几 乎 所 有 的 计算 机 都 不 同 程度 地 应 用 
了 并 行 的 概念 。 指 令 均 使 用 字 作为 操作 数 (通常 计算 机 的 字 长 为 16 位 、32 位 或 64 位) ， 而 不 是 每 次 都 
只 对 单一 位 发 生 作 用 。 较 高 级 的 并 行 技术 需要 有 专门 设计 的 复杂 硬件 和 操作 系统 的 支持 。 

有 关 并 行 执行 的 深入 研究 已 经 超出 了 本 书 的 范围 ， 这 里 只 是 简单 介绍 两 个 并 行 问题 的 极端 情形 : 
程序 级 的 并 行 执行 (PLP) 和 指令 级 的 并 行 执行 (ILP)。PLP 实际 上 是 指 一 个 程序 的 各 部 分 可 以 同时 
在 多 台 计 算 机 上 运行 。 这 个 问题 看 似 简 单 ， 但 却 要 求 对 程序 的 算法 进行 正确 的 编码 ， 才 有 可 能 发 生 并 
行 执行 。 同 时 ， 需 要 确保 在 程序 的 模块 之 间 有 非常 严格 的 同步 。 

ILP 是 利用 技术 在 时 间 上 重合 执 行 指令 。 从 本 质 上 来 说 ,我 们 希望 单一 程序 中 的 多 条 指令 并 发 地 
执行 。ILP 分 为 两 种 类 型 : 第 一 种 类 型 是 将 一 条 指令 的 执行 分 解 成 若干 步 又 ， 并 在 时 间 上 重 亚 执行 这 
些 步 骤 。 这 实际 上 就 是 流水 线 的 功能 。 第 二 种 类 型 的 ILP 是 利用 不 同 的 指令 在 时 间 上 重 伙 执行， 即 处 
理 器 本 身 可 以 在 同一 时 刻 执行 多 条 指令 。 

ILP 除了 有 流水 线 体系 结构 外 ， 还 有 超标 量 体 系 结构 、 超 流水 线 体系 结构 和 超 长 指令 字 (VLIW) 
体系 结构 。 超 标量 (superscalar) 体系 结构 是 利用 多 条 平行 的 流水 线 同时 执行 多 个 操作 (参阅 第 4 
章 )。 超 标量 体系 结构 包括 IBM 公司 的 Power PC、Sun 公司 的 Ultrasparc 和 DEC 公司 的 Alpha。 超 流 
水 线 (superpipelining) 体系 结构 则 是 将 超标 量 体 系 结构 和 流水 线 体 系 结构 的 概念 组 合 起 来 ， 把 流水 线 
的 各 个 级 分 割 成 更 小 的 步 又 。 而 IA-64 体系 结构 却 是 一 个 超 长 指令 字 (VLIW) 体系 结构 ， 即 每 条 指令 
可 以 指定 多 个 标量 操作 ， 也 就 是 编译 器 可 以 把 多 个 操作 放 到 一 条 指令 中 。 超 标量 和 VLIW 体系 结构 可 
以 在 一 个 时 钟 周 期 内 进行 取 指 和 执行 多 条 指令 。 


5.6 ISA 体系 结构 的 真实 案例 


现在 ,我 们 再 来 讨论 第 4 章 介绍 两 种 体系 结构 : Intel 体系 结构 和 MIPS 体系 结构 。 目 的 是 了 解 这 
两 种 体系 结构 的 处 理 器 的 设计 师 是 如 何 处 理 本 章 所 遇 到 的 一 些 问 题 : 如 指令 格式 、 指 令 类 型 、 操 作 数 
的 数目 、 地 址 编 址 和 流水 线 等 。 另 外 将 介绍 Java 虚拟 机 以 说 明 如 何 利用 软件 来 创建 一 种 抽象 的 指令 系 
统 〈ISA)， 而 可 以 完全 不 考虑 计算 机 的 真实 指令 系统 。 


5.6.1 ntel 体系 结构 
Intel 使 用 的 是 小 端 、 双 地 址 的 体系 结构 ， 并 且 采 用 可 变 长 度 的 指令 系统 。Intel 处 理 器 的 指令 系统 
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采用 的 是 寄存 器 -存储 器 结构 ， 即 所 有 的 指令 都 可 以 对 一 个 存储 器 单元 进行 操作 ， 但 另 一 个 操作 数 却 必 
须 是 寄存 器 。 这 种 指令 系统 允许 执行 可 变 长 度 的 操作 ， 操 作 数据 的 长 度 可 以 是 1 字 节 、2 字 节 或 4 
字 节 。 

从 8086 到 80486 都 是 单 级 流水 线 体系 结构 。 架 构 师 推断 如 果 使 用 一 条 流水 线 很 好 ， 那 么 使 用 两 条 
流水 线 会 更 好 。Intel 的 奔腾 结构 就 采用 两 条 平行 的 5 级 流水 线 来 执行 指令 ， 这 两 条 流水 线 分 别称 为 U 
线 和 V 线 , 它们 的 不 同 级 (步骤 ) 分 别 包 括 : 指令 预 取 、 指 令 译 码 、 地 址 生成 、 指 令 执行 和 回 写 。 为 
了 CPU 的 高 效率 运行 ， 这 些 流 水 线 都 必须 保持 被 填 满 的 状态 ， 即 要 求 并 行 地 发 出 指令 。 编 译 器 的 任务 
就 是 确保 这 种 并 行 过 程 的 发 生 。 而 奔腾 II 系列 就 已 经 将 两 条 流水 线 的 步骤 增加 到 12 级 ， 包 括 ， 指令 预 
取 、 长 度 译 码 、 指 令 译 码 、 重 命名 /资源 分 配 、 微 指令 《UOP)》 事务 安排 /分 派 、 指 令 执行 、 回 写 和 退 
回 。 大 部 分 新 增加 的 流水 线 级 都 用 来 支持 Intel 的 MMX 技术 ，MMX 技术 是 Intel 公司 为 处 理 多 媒体 数 
据 而 对 CPU 体系 结构 功能 的 扩充 。 奔 腾 III 的 流水 线 增加 到 14 级 ， 而 奔腾 IV 则 增加 到 24 级 。 这 些 附 
加 的 流水 线 级 〈 指 除 本 章 所 介绍 流水 线 级 的 之 外 ) 包括 一 些 决定 指令 长 度 的 步 又， 一 些 产 生 微 操 作 的 
步骤 和 一 些 提交 (commit〉 指令 〈 即 确认 执行 指令 ， 并 且 执 行 的 结果 变 成 永久 性 ) 的 步骤。 而 Itanium 
体系 结构 却 只 有 一 个 10 级 的 指令 流水 线 。 

Intel 处 理 器 支持 本 章 所 介绍 的 各 种 基本 寻 址 方式 ， 同 时 还 支持 多 种 由 这 些 方式 组 合 形成 的 寻 址 方 
式 。 例 如 ，8086 就 有 17 种 不 同 的 访问 存储 器 的 方式 ， 其 中 大 部 分 都 是 几 个 基本 寻 址 方式 的 变化 形式 。 
Intel 公司 最 流行 的 奔腾 处 理 器 系列 体系 结构 不 但 包含 公司 的 前 代 产 品 所 具有 的 相同 寻 址 方式 ， 而 且 同 
时 还 引入 了 一 些 新 的 寻 址 方式 。 通常，Intel 体系 结构 的 各 种 寻 址 方式 都 保持 了 向 下 的 兼容 性 。 出 人 意 
料 的 是 ，Intel 的 IA-64 体系 结构 的 存储 器 寻 址 方式 却 只 有 一 种 : 寄存 器 间接 寻 址 (具有 可 选 的 后 增 
量 )。 看 起 来 ， 这 种 对 寻 址 方式 的 限制 很 不 寻常 ， 但 却 是 遵循 了 RISC 设计 思想 的 指导 原则 。 地 址 在 通 
用 寄存 器 中 进行 计算 和 存储 。 更 加 复杂 的 寻 址 方式 需要 特殊 的 硬件 支持 。 通 过 限制 寻 址 方式 的 数目 ， 
IA-64 体系 结构 将 对 这 种 特殊 硬件 的 需求 减 至 最 少 。 


5.6.2 MIPS 体系 结构 


MIPS 体系 结构 ， 最 初代 表 的 是 无 自 锁 流 水 线 级 的 微 处 理 器 。MIPS 是 一 种 小 端 、 按 字 编 址 、3 地 
址 和 采用 固定 长 度 的 指令 系统 。 这 是 一 种 装 人 /存储 式 的 体系 结构 ， 也 就 是 说 只 有 在 装 人 指令 和 存储 指 
令 时 才能 访问 存储 器 。 而 其 他 的 所 有 指令 都 必须 使 用 寄存 器 作为 操作 数 ， 因 此 MIPS 体系 结构 需要 配 
备 一 个 很 大 的 寄存 器 组 。MIPS 体系 结构 还 限制 只 有 固定 长 度 的 操作 ， 操 作 数 据 必 须 具 有 相同 的 字 
节 数 。 

某 些 MIPS 处 理 器 ， 如 R2000 和 R3000 CPU， 有 5 级 流水 线 。R4000 和 R4400 处 理 器 有 8 级 超 流 
水 线 。R10000 处 理 器 的 流水 线 的 级 数 取 决 于 执行 指令 需要 经 过 的 功能 单元 : 对 于 整数 指令 为 5 级 流水 
线 ， 装 人 /存储 指令 为 6 级 流水 线 ， 而 浮 点 运算 指令 为 7 级 流水 线 。 实 际 上 ，R5000 和 R10000 处 理 器 
都 属于 超标 量 体 系 结构 。 

MIPS 体系 结构 的 指令 系统 共有 5 种 类 型 的 指令 ， 执行 简单 算术 操作 的 指令 例如， 加 法 、 异 或 、 
与 非 、 移 位 等 )， 数 据 移动 指令 (例如 ， 装 入 、 移 动 等 );， 控 制 转移 指令 (如 分 支 转移 、 跳 转 转移 )， 多 
重 循环 指令 〈 乘 法 、 除 法 ) ， 以 及 其 他 杂 类 的 指令 〈 如 存储 PC， 有 条 件 存储 寄存 器 ，)。MIPS 机 器 的 程 
序 员 可 以 使 用 立即 寻 址 、 寄 存 器 寻 址 、 直 接 寻 址 、 间 接 寄存 器 寻 址 、 基 地 址 寻 址 和 变 址 寻 址 等 寻 址 方 
式 。 但 是 ，MIPS 的 指令 系统 只 提供 一 种 寻 址 方式 ， 即 基地 址 寻 址 方式 。 而 一 些 其 他 寻 址 方式 是 由 
MIPS 的 编译 器 提供 的 。MIPS 64 处 理 器 在 说 人 式 系统 的 优化 应 用 时 还 有 另外 的 两 种 寻找 方式 。 

第 4 章 介绍 的 MIPS 的 指令 分 为 4 个 域 : 一 个 操作 码 域 、 两 个 操作 数 地 址 域 和 一 个 结果 地 址 域 。 
从 本 质 上 来 说 ，MIPS 具有 三 种 类 型 的 指令 格式 : 1 类 型 (immediate) 指令 、R 类 型 〈register) 指令 
和 J 类 型 (jump) 指令 。 

R 类 型 指令 包括 一 个 6 位 操作 码 、 一 个 5 位 的 源 寄存 器 、 一 个 5 位 的 目标 寄存 器 、 一 个 5 位 偏 移 
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量 和 一 个 6 位 的 功能 代码 。I 类 型 的 指令 包括 一 个 6 位 操作 数 、 一 个 5 位 的 源 寄存 器 、 一 个 5 位 的 目标 


寄存 器 或 分 支 转移 条 件 ， 以 及 一 个 16 位 的 立即 分 支 转移 位 移 量 或 地 址 位 移 量 。J 类 型 的 指令 则 包括 一 
个 6 位 操作 码 和 一 个 26 位 的 目标 地 址 。 


5.6.3 Java 虚拟 机 


Java 是 一 种 现在 非常 流行 的 计算 机 编程 语言 。 有 趣 的 是 ，Java 语言 与 工作 平台 无 关 。 这 就 是 说 ， 
如 果 利 用 Java 语言 在 某 种 计算 机 体系 结构 例如， 奔腾) 上 进行 代码 编程 ， 那 么 这 些 程序 可 以 在 另 
外 一 种 不 同 的 计算 机 体系 结构 〈 例 如 ，Sun 的 工作 站 ) 上 运行 ， 甚 至 无 需 对 原 程序 进行 修改 和 重新 
编译 。 

首次 对 Java 程序 进行 编译 时 ，Java 编译 器 不 需要 考虑 运行 程序 的 计算 机 体系 结构 内 部 的 具体 细 
节 : 例如 寄存 器 的 数目 、 内 存 的 大 小 、 或 者 是 输入 输出 (I/O) 端口 等 。 但 是 ， 如 果 编 译 完 成 后 ， 要 
执行 这 种 Java 程序 ， 就 需要 在 运行 程序 的 实际 机 器 体系 结构 上 生成 一 个 Java 虚拟 机 (Java Virtual 
Machine，JVM) 。 虚 拟 机 是 真实 机 器 的 一 种 软件 仿真 。JVM 在 本 质 上 是 硬件 机 器 结构 的 “包装 外 壳 
(wrapper)”， 并 且 是 与 工作 平台 有 关 的 。 奔 腾 机 器 的 JVM 不 同 于 Sun 公司 的 工作 站 的 JVM， 它 们 也 
不 同 于 Macintosh 或 者 其 他 类 型 的 机 器 的 JVM。 然 而 ， 特 定 的 体系 结构 的 JVM 一 旦 生成 ， 就 可 以 利 
用 JVM 来 执行 在 任意 指令 系统 (ISA) 平台 上 编译 的 Java 程序 。 程 序 执行 过 程 中 ， 由 JVM 负责 装 
和 人 入、 检查 、 寻 找 和 执行 字 节 编码 。JVM 虽然 是 虚拟 机 器 ， 但 却 是 一 个 精心 设计 的 指令 系统 的 很 好 的 
例子 。 

不 同体 系 结构 的 JVM 是 按照 机 器 固有 的 指令 集 编写 的 。JVM 的 作用 相当 于 一 个 解释 程序 : 读 取 
Java 字 节 码 ， 并 将 这 些 字 节 码 解 释 成 各 种 清晰 明了 的 机 器 指令 。 在 对 Java 程序 进行 编译 时 ， 会 生成 特 
殊 的 字 节 码 〈bytecodes) 。 这 些 字 节 码 就 是 JVM 的 输入 源 程 序 。 我 们 可 以 将 JVM 比 作 一 个 巨大 的 开 
关 (或 case) 语句 ， 这 个 开关 语句 每 次 分 析 一 条 字 节 码 指令 。 每 个 字 节 码 指令 的 执行 都 会 造成 程序 跳 
转 到 某 个 特定 的 程序 代码 段 ， 去 完成 给 定 的 字 节 码 指令 。 

这 种 程序 的 工作 方式 与 读者 熟悉 的 其 他 高 级 程序 语言 上 有 很 大 的 不 同 。 例 如 ， 如 果 编 译 C++ 十 程序， 
生成 的 结果 代码 一 定 是 要 针对 特定 的 体系 结构 才 适 用 。 编 译 C+ 二 程序 将 产生 一 个 对 应 的 汇编 语言 程 
序 ， 该 汇编 语言 程序 然后 被 翻译 成 相对 应 的 特定 的 机 器 代码 。 如 果 要 使 编译 过 的 C++ 程序 能 够 在 一 个 
不 同 的 工作 平台 上 运行 ， 则 必须 针对 不 同 的 目标 体系 结构 对 C++ 程序 进行 重新 编译 。 经 过 编译 的 程序 
语言 会 由 指定 的 编译 器 翻译 成 可 执行 的 二 进 制 机 器 代码 文件 。 显 然 ， 这 种 机 器 代码 一 旦 生成 ， 就 只 能 
在 特定 的 目标 体系 结构 上 运行 。 编 译 好 的 程序 语言 通常 具有 非常 好 的 可 执行 性 能 ， 而 且 可 以 与 操作 系 
统 进行 很 好 的 交互 访问 。 编 译 语 言 的 例子 包括 :C 语言 、C++ 语 言 、Ada 语言 、FORTRAN 请 言 和 
COBOL 语言 等 。 

还 有 一 些 编程 语言 ， 比 如 LISP 语言 、PhP 诸 言 、Perl 语言 、Python 语言 和 Tcl 语言， 以 及 大 部 
分 的 BASIC 语言 ， 都 是 解释 性 的 编程 语言 。 每 次 执行 采用 这 些 语言 编写 的 程序 时 ， 都 要 重新 对 源 程序 
进行 解释 。 这 种 解释 程序 语言 与 工作 平台 无 关 , 但 是 所 付出 的 代价 是 程序 执行 的 速度 比较 慢 ， 通 常会 
比 编译 程序 慢 100 倍 。 第 8 章 我 们 将 对 这 个 主题 做 更 多 的 讨论 。 

还 有 一 些 编程 语言 同时 以 两 种 形式 ( 即 编译 形式 和 解释 形式 ) 存在 。 这 些 编 程 语言 通常 称 为 
P 代码 语言 (P-code Language) 。 利 用 这 种 语言 编写 的 源 代码 首先 编译 成 一 种 中 间 形 式 的 代码 ， 称 
为 P 代 码 ， 然 后 机 器 会 对 了 代码 进 行 解 释 执行 。P 代 码 程序 语言 的 运行 速度 一 般 比 编译 程序 语言 
慢 5 到 10 倍 。Python 语言 、Perl 语言 和 Java 语言 实际 上 是 P 代码 语言 ， 尽 管 通常 人 们 称 它们 为 
解释 语言 。 

图 5-6 展示 Java 语言 编程 环境 的 概要 图 。 

除 上 面 所 介绍 的 Java 语言 与 工作 平台 无 关 之 外 ， 更 有 趣 的 是 Java 语言 的 字 节 码 事实 上 是 一 种 基于 
堆栈 的 语言 ， 其 中 的 部 分 字 节 码 由 0 地 址 指令 组 成 。Java 语言 的 每 条 指令 都 是 由 一 个 单字 节 的 操作 码 ， 
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后 面 跟 零 个 或 多 个 操作 数 而 构成 。 操 作 码 本 身 就 已 经 决定 了 操作 码 后 面 是 否 需要 操作 数 ， 以 及 操作 数 
(如 果 有 的 话 ) 的 形式 。 这 类 指令 中 的 很 多 指令 都 不 需要 操作 数 。 


编译 时 环境 






Program Source File: 
(file.java) 












Java Compiler 


Program Class Files 
(file.class) 了。 
The Actual Bytecode 







Execution 
Engine : 


a 


图 5-6 Java 编程 环境 


Java 语言 采用 补 码 形式 (2 补 表示 法 ) 表示 带 符号 整数 ， 但 不 允许 有 无 符号 整数 。 字 符 使 用 16 位 
统一 编码 。Java 虚拟 机 有 4 个 寄存 器 ， 支 持 访问 5 个 不 同 的 主 存储 器 区 域 。 所 有 对 存储 器 的 调用 或 访 
问 都 是 基于 来 自 寄存 器 中 存放 的 偏 移 量 。 在 Java 虚拟 机 中 ， 从 来 不 使 用 指针 或 绝对 地 址 。 因 为 JVM 
是 堆栈 类 型 的 机 器 ， 所 以 没有 提供 通用 寄存 器 。 当 然 ， 没 有 通用 寄存 器 会 限制 机 器 的 性 能 ， 因 为 需要 
产生 更 多 的 存储 器 调用 过 程 。 所 以 ， 我 们 需要 在 程序 的 可 移植 性 和 工作 性 能 之 间 做 出 权衡 。 

下 面 考虑 一 个 简短 的 Java 程序 和 对 应 的 字 节 码 。 例 5-2 是 一 个 求 两 个 数字 中 的 最 大 数 的 Java 


程序 。 
例 5-2 ”一 个 Java 程序 ， 求 两 个 数字 中 的 最 大 数 。 


public class Maximum { 


public static void main (String[] Args) 
人 EX 2s 

X = Integer.parseInt(Args[0] ) ; 

Y = Integer.parseInt(Args[1]) ; 

2 = Max(X,Y); 

System.out .println(Z) ; 
3 


public static int Max (int A, int B) 
{ int CG» 
if (A>B)C=A; 
else C=B; 
return C; 
) 
} 


在 完成 对 程序 编译 使 用 javac 编译 源 程序 ) 后 ， 可 以 通过 发 送 以 下 命令 ， 对 程序 进行 拆 解 以 检查 
字 节 码 ， 

javac - C Maximum 

于 是 ,读者 就 可 以 看 到 下 面 的 程序 : 


Compiled from Maximum.java 
public class Maximum extends java.lang.Object 人 
public Maximum() ; 
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public static void main(java.lang.String[]): 
public static int Max(int, int),; 
} 


Method Maximum() 
0 aload_0 
1 invokespecial #1i 《Method java.lang.Object()> 
4 return 
Method void main(java.lang.String[]) 
0 aload 0 
1 iconst_0 
2 aaload 
3 invokestatic #2 《Method int parseInt (java.lang.String)> 
6 istore_l 
7 aload_0 
8 iconst_ 1 
9 aaload 
10 invokestatic #2 <Method int parseInt(java.lang.String)> 
13 istore 2 
14 ilioad_1 
15 iload 2 
16 invokestatic #3 <Method int Max(int, int)> 
19 istore _3 
20 getstatic #4 《Field java.io.PrintStream out> 
23 iload_3 
24 invokevirtual #5 《Method void println(int)> 
27 return 


Method int Max(int, int) 

0 iload_0 

1 iload_ 1 

2 if_icmple 10 
5 iload 0 

6 istore 2 

7 goto 12 

10 iload 1 

11 istore 2 

12 iload_2 

13 ireturn 


程序 中 每 行 的 标号 表示 一 个 偏 移 量 ,或 者 说 一 条 指令 偏离 当前 方法 的 开始 位 置 的 字 节 数 。 注 意 : 

Z = Max (X,Y); 

会 被 编译 成 如 下 的 字 节 码 : 

14 iload 1 

15 iload 2 

16 invokestatic #3 《Method int Max(int, int)> 

19 istore_ 3 LJ 

显然 ，Java 字 节 码 是 基于 堆栈 的 编码 。 例 如 ， 指 令 iadd 会 从 堆栈 中 弹出 两 个 整数 ， 将 它们 相 加 ， 然 后 
将 结果 压 回 堆栈 中 。 这 里 ， 不 会 出 现 像 “add r0，rl，f2” 或 “add AC，X” 这 种 类 型 的 指令 的 情况 。 指 令 
iload _ 1 (整数 装 入 指令 ) 也 同样 是 使 用 堆栈 ， 将 第 一 列 的 元 素 压 人 堆栈 中 。 主 群 组 中 的 第 一 列 元 素 包 含 整 
数 X， 所 以 和 被 压 人 堆栈 中 。Y 也 通过 指令 15 被 压 人 堆栈 中 。 而 指令 invokestatic 实际 上 执行 的 是 Max 
方法 调用 。 在 Max 方法 完成 之 后 ， 指 令 istore ”3 就 将 堆栈 顶部 的 元 素 弹 出 ， 并 且 存 储 到 数组 Z。 

第 8 章 将 更 详细 地 探讨 有 关 Java 语言 和 Java 虚拟 机 (JMVM) 的 问题 。 
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本 章 小 结 


指令 系统 体系 结构 的 核心 元 素 包 括 存储 器 模型 〈 字 长 度 和 地 址 空间 的 分 配方 法 ) 、 寄 存 器 、 数 据 类 型 、 
指令 格式 、 寻 址 方式 和 指令 类 型 。 虽 然 当 今 的 大 部 分 计算 机 系统 都 有 通用 寄存 器 组 ， 并 且 相 以 通过 存储 器 
和 寄存 器 单元 的 各 种 组 合 方式 来 指定 操作 数 。 但 是 ， 不 同体 系 结构 的 计算 机 指令 的 大 小 、 类 型 、 格 式 和 指 
令 需 要 操作 数 的 数目 都 有 所 不 同 。 指 令 同 样 对 操作 数 的 存放 位 置 也 有 严格 的 要 求 。 操 作 数 可 以 位 于 堆栈 、 
寄存 器 组 、 存 储 器 单元 ， 或 者 是 三 者 的 某 个 组 合 形式 中 。 

设计 指令 系统 时 ， 需 要 事先 做 出 许多 重要 的 决定 。 较 大 的 指令 系统 允许 较 长 的 指令 ， 况 用 较 长 的 指令 
也 就 意味 着 需要 较 长 的 取 指 和 译 码 时 间 。 国 定 长 度 的 指令 译 码 比较 方便 ， 但 可 能 会 浪费 空间 。 扩 展 操 作 码 
则 是 在 采用 大 指令 集 和 使 用 短 指令 之 间 的 一 种 折衷 方案 。 使 用 小 端 字 节 排序 还 是 使 用 大 端 字 节 排序 可 能 是 
最 令 人 感 兴趣 的 问题 。 

CPU 有 三 种 内 部 存储 方式 : 堆栈 、 累 加 器 或 通用 寄存 器 。 每 种 方式 都 各 有 优 缺 点 ， 具 体 方 案 需 要 考虑 
所 设计 的 计算 机 体系 结构 的 应 用 范围 。CPU 内 部 存储 系统 的 选择 方案 会 对 设计 指令 系统 的 指令 格式 有 直接 
影响 ， 特 别 是 会 影响 到 指令 允许 引用 的 操作 数 的 数目 。 堆 栈 结构 的 指令 不 需要 操作 数 ， 非 常 适 合 于 寄存 器 
传输 表示 法 (RPN)。 

指令 可 以 归纳 为 下 面 几 种 类 型 : 数据 移动 指令 、 算 术 运 算 指 令 、 迎 辑 运算 指令 、 位 操作 指令 、 输 入 输 
出 〈IMO) 指令 、 控 制 转移 指令 和 某 些 专用 指令 。 有 些 指 令 系统 在 各 种 类 型 的 指令 中 都 有 多 条 指令 ， 而 另外 
的 一 些 指令 系统 在 各 类 指令 中 可 能 都 只 有 为 数 不 多 的 几 条 指令 。 在 大 多 数 的 指令 系统 中 ， 不 同类 型 的 指令 
数目 一 般 比 较 均衡 。 

随 着 存储 器 技术 的 不 断 发 展 ， 使 用 的 存储 器 越 来 越 大 。 因 此 ， 需 要 有 各 种 不 同 的 寻 址 方式 。 计 算 机 技 
术 中 引入 了 各 种 不 同 的 寻 址 方式 : 立即 寻 址 、 直 接 寻 址 、 间 接 寻 址 、 寄 存 器 寻 址 、 变 址 方式 寻 址 和 堆栈 寻 
址 等 等 。 各 种 寻 址 方式 为 程序 员 提供 了 很 大 的 灵活 性 和 便利 性 ， 使 他 们 在 无 需 改变 CPU 基本 功能 的 情况 下 
即 可 实现 各 种 程序 操作 。 

指令 级 的 流水 线 是 指令 并 行 执行 的 一 个 典型 例子 。 这 是 一 种 加 速 计算 机 的 取 指 - 译 码 -执行 周期 的 通用 
技术 ,但 是 流水 线 技术 本 身 比较 复杂 。 利 用 流水 线 技术 可 以 将 指令 的 执行 过 程 在 时 间 上 进行 重合 处 理 ， 从 
而 并 行 地 执行 多 条 指令 。 但 是 注意 ， 流 水 线 中 可 以 并 行 执行 指令 的 数目 可 能 会 由 于 指令 功能 的 冲突 而 受到 
限制 。 流 水 线 技术 是 同时 执行 多 条 指令 的 不 同步 骤 ， 而 超标 量 结构 则 可 以 同时 执行 多 个 操作 。 除 了 超 长 指 
令 字 (VLIW) 外 ， 本 章 对 作为 超标 量 技术 和 流水 线 技 术 组 合 的 超 流水 线 技术 也 做 了 简要 的 介绍 。 并 行 执 
行 技 术 有 许多 类 型 ， 但 是 在 计算 机 组 成 原理 和 体系 结构 的 层次 ， 实 际 上 我 们 主要 关心 ILP。 

正如 本 章 和 第 4 章 中 所 介绍 的 ，Intel 指令 系统 和 MIPS 指令 系统 都 是 非常 令 人 感 兴趣 的 。 然 而 ，Java 
虚拟 机 却 有 独一无二 的 指令 系统 ， 因 为 JVM 的 这 种 指令 系统 是 利用 软件 来 构建 的 。 因 此 ，jJava 程序 可 以 
利用 Java 虚拟 机 在 任何 支持 JVM 的 机 器 上 运行 。 第 8 章 将 详细 讨论 JVM。 
深入 阅读 

有 关 指 令 系 统 、 寻 址 方法 和 指令 格式 方面 的 内 容 在 几乎 每 一 本 计算 机 体系 结构 的 书籍 都 有 详细 的 论述 。 
，Patterson 和 Hennessy (1997) 的 著作 是 一 本 有 关 这 些 内 容 的 很 好 的 参考 书 。 有 关 Intel x86 体系 结构 方面 
的 著作 很 多 ， 比 如 Brey (2003)，Messsmer (1993)，Abel (2001) 和 Jones (2001) 等 的 书籍 。 如 果 读 者 
对 Motorola 6800 系列 感 兴趣 的 话 ， 可 以 参阅 Wray 和 Greenfield (1994) 以 及 Miller (1992) 的 书籍 。 

Sohi (1990) 的 文章 很 好 地 讨论 了 有 关 指 令 级 流水 线 结构 的 问题 。Kaeli 和 Emma (1991) 则 详细 论述 
了 分 支 转移 指令 对 流水 线 结构 性 能 的 影响 。 要 了 解 流水 线 结构 的 发 展 过 程 可 以 参阅 Rau 和 Fisher (1993) 
的 论文 。 阅 读 Wall (1993) 的 文章 可 以 更 好 地 了 解 流水 线 结构 的 局 限 性 和 可 能 遇 到 的 问题 。 

虽然 第 4 章 讨论 了 特定 的 计算 机 结构 ， 但 是 还 有 许多 重要 的 指令 系统 体系 结构 值得 一 提 。Atanasoff 的 
ABC 计算 机 (Burks 和 Burks [1988])，Von Neumann 的 EDVAC 计算 机 以 及 Mauchly 和 Eckert 的 UNI- 
VAC 计算 机 (Stern [1981]) 都 带 有 简单 的 指令 系统 体系 结构 ， 需 要 使 用 机 器 语言 进行 编程 。Intel 8080 
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(1 地 址 计算 机 ) 属于 第 4 章 介绍 的 80x86 系列 芯片 的 一 种 早期 产品 。 如 需 详细 了 解 Intel 早期 的 产品 系列 ， 
可 以 阅读 Brey (2003) 的 著作 。 而 Hauck (1968) 则 介绍 了 Burroughs 的 0 地 址 计算 机 ; Struble (1968) 
论述 了 IBM 360 系列 计算 机 ; Brunner (1991) 详细 讨论 了 DEC 的 VAX 系统 ， 这 种 机 器 采用 较 复杂 的 2 地 
址 指令 系统 ; SPARC (1994) 的 著作 很 好 地 介绍 了 SPARC 体系 结构 。 从 Meyer 和 Downing (1991) 的 著 
作 ，Lindholm 和 Yellin 以 及 Venner 的 网 站 可 以 很 好 地 了 解 有 关 Java 虚拟 机 的 知识 。 
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基本 概念 和 术语 复习 


. 解释 有 关 寄 存 器 -寄存 器 指令 、 寄 存 器 -存储 器 指令 和 存储 器 -存储 器 指令 的 区 别 。 

. 在 设计 指令 系统 之 前 需要 做 出 一 些 重要 的 决定 ， 指 出 4 种 需要 决定 的 事项 并 给 出 -一些 解释 。 

. 什么 是 扩展 操作 码 ? 

. 如果 要 在 一 个 32 位 字 、 按 字 节 寻 址 的 计算 机 中 存储 十 六 进 制 数值 98765432， 分 别 指出 这 个 数值 在 小 端 

机 器 和 大 端 机 器 中 的 存储 方式 。 为 什么 这 些 存储 方式 会 与 机 器 的 大 小 端 有 关 ? 

5. 设计 指令 系统 时 可 以 采用 堆栈 体系 结构 、 累 加 器 体系 结构 或 通用 寄存 器 体系 结构 。 解 释 采 用 这 些 不 同体 

系 结构 的 指令 系统 有 何 差别 ， 以 及 在 何 种 情形 下 选择 哪 种 结构 比较 好 。 

. 存储 器 -存储 器 指令 体系 结构 、 寄 存 器 -存储 器 指令 体系 结构 以 及 装 人 -存储 指令 体系 结构 有 何 异 同 点 。 

. 固定 长 度 和 可 变 长 度 的 指令 结构 各 有 什么 优 缺 点 ?当前 哪 一 种 指令 结构 更 流行 ? 

. 解释 一 个 基于 零 操作 数 的 指令 系统 怎样 从 内 存 中 获取 数据 值 ? 

. 分 别 采 用 0 地 址 指令 体系 结构 、1 地 址 指令 体系 结构 和 2 地 址 指令 体系 结构 编写 程序 ， 哪 一 种 程序 的 长 

度 可 能 会 钢 长 一 些 ( 即 包含 更 多 的 指令 )? 为 什么 ? 

10. 为 什么 堆栈 体系 结构 可 以 使 用 反 向 波兰 表示 法 RPN) 来 表示 算术 表达 式 ? 

11. 列举 7 种 类 型 的 数据 指令 ， 并 分 别 做 出 解释 。 

12, 什么 是 寻 址 方式 ? 

13. 举例 说 明 下 列 的 寻 址 方式 :立即 寻 址 、 直 接 寻 址 、 寄 存 器 寻 址 、 间 接 寻 址 、 寄 存 器 间接 寻 址 和 变 址 导 
址 。 

14. 变 址 寻 址 和 基 址 寻 址 方式 有 何不 同 ? 

15. 为 什么 需要 有 多 种 不 同 的 寻 址 方式 ? 

16. 解释 有 关 流 水 线 体系 结构 的 基本 概念 。 

17. 假如 一 个 时 钟 周 期 为 20ns 的 4 级 流水 线 体系 结构 ， 需 要 处 理 100 个 任务 ， 试 问 从 理论 上 可 以 获得 的 加 
速 比 是 多 少 ? 

18. 造成 流水 线 体系 结构 速度 减 慢 的 冲突 有 哪些 ? 

19. 有 哪 两 种 类 型 的 ILP， 它 们 之 间 有 什么 不 同 ? 

20. 分 别 解释 什么 是 超标 量 体 系 结构 、 超 流水 线 体系 结构 和 VLIW 体系 结构 。 

21. 分 别 列举 Intel 指令 系统 和 MIPS 指令 系统 的 几 种 异同 点 。 

22. 解释 什么 是 Java 字 节 编码 。 

23. 分 别 举 出 一 个 当前 流行 的 基于 堆栈 体系 结构 和 基于 GPR 体系 结构 的 例子 。 并 说 明 它们 有 什么 差别 ? 


练习 题 


1. 假设 现在 有 一 个 使 用 32 位 整数 的 按 字 节 编 址 的 计算 机 ， 并 且 要 将 十 六 进 制 数值 1234 存储 在 地 址 0 处 。 
令 a) 说 明 在 大 端 机 器 中 的 存储 方式 。 
争 b) 说 明 在 小 端 机 器 中 的 存储 方式 。 
c) 如 果 将 存储 的 十 六 进 制 数 增 大 为 123456， 哪 一 种 字 节 排序 方式 会 更 有 效 ， 大 端 方式 还 是 小 端 方式 ? 
解释 原因 。 

2. 说 明 如 何 将 以 下 的 数值 存储 到 按 字 节 编 址 的 32 位 字 计 算 机 中 ， 先 采用 小 端 排序 格式 ， 然 后 采用 大 端 排 
序 格式 。 假 定 每 个 数值 的 存储 地 址 都 从 101; 开 始 。 对 每 个 数值 的 存放 都 画 出 内 存 分布 图 ， 并 在 各 个 相关 
(并 加 注 标 号 ) 的 内 存单 元 位 置 放 人 正确 的 数值 。 

a) 456789Alie 
b) 0000058Ais 
c) 141488881¢ 
43. 已 知 2MX16 的 主 存储 器 的 前 两 个 字 节 中 有 如 下 的 十 六 进 制 数值 : 


心 co co 王 


oo OD 





S7. 


8 
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。 字 节 0 处 为 FE 

*， 字 节 1 处 为 01 

如 果 这 些 字 节 保存 的 是 一 个 16 位 2 补 整数 ， 问 如 果 按 照 如 下 的 方式 存储 数据 ， 那 么 实际 存放 的 十 进 制 
数值 分 别 是 多 少 ? 


令 a) 存储 器 是 大 端 格式 。 
令 b) 存储 器 是 小 端 格式 。 

4. 
令 5. 


如 果 将 数据 从 大 端 机 器 转移 到 小 端 机 器 时 ， 这 种 排序 方式 的 改变 会 产生 什么 问题 ? 并 解释 原因 。 

美国 人 口 研究 学 会 负责 监测 美国 全 国 的 人 口 数 。2000 年 ， 该 学 会 编写 了 一 个 程序 ， 用 来 生成 一 个 代表 美 
国 各 州 的 人 口 数 以 及 全 国 总 人 口 数 的 文件 。 该 程序 在 一 台 Motorola 的 处 理 器 上 运行 ， 可 以 按照 各 种 不 同 
的 规则 来 计算 人 口 数 ， 例 如 根据 每 年 的 平均 出 生 率 和 死亡 率 。 学 会 通过 运行 这 个 程序 将 输出 结果 文件 报 
告 给 相关 的 政府 机 关 部 门 ， 以 用 于 各 种 不 同 的 用 途 。 但 是 ， 在 宾夕法尼亚 〈Pennsylvania) 州 的 政府 机 
关 ， 由 于 各 部 门 使 用 的 都 是 Intel 的 计算 机 ， 结 果 遇 到 了 下 面 的 困难 。 当 32 位 无 符号 整数 1D2F37E8,。 
(代表 2003 年 所 预测 的 美国 全 国 总 人 口 数量 ) 输入 到 州 政 府 机 关 的 计算 机 系统 时 ， 程 序 只 是 简单 地 输出 
这 个 输入 数值 。 原 因 是 2003 年 美国 人 口 预测 的 数值 太 大 ， 计 算 机 无 法 处 理 。 请 帮助 宾夕法尼亚 州 政 府 
解释 是 什么 原因 造成 了 这 种 错误 ? 


. 对 于 计算 机 设计 人 员 来 说 ， 有 各 种 理由 来 要 求 所 有 的 指令 都 应 该 具有 相同 的 长 度 。 请 解释 为 什么 对 采用 


堆栈 体系 结构 的 计算 机 来 说 ， 设 计 相同 长 度 的 指令 系统 并 不 是 一 个 好 的 方案 ? 
已 知 某 台 计算 机 使 用 32 位 指令 和 12 位 地 址 ， 如 果 共 有 250 个 2 地 址 指令 ， 请 回答 该 计算 机 还 可 以 设计 
多 少 个 1 地 址 指令 ， 为 什么 ? 


. 将 下 列表 达 式 由 中 缀 表示 法 变换 成 反 向 波兰 (后 级 ) 表示 法 : 


Ga) XxXY+WXZ+VXU 
b) WxX+WXx (UXV+Z2) 
c) (WX(X+YX(UXVW)/UX(X+Y)) 


. 将 下 列表 达 式 由 反 向 波兰 〈 后 级 ) 表示 法 变换 成 中 组 表示 法 ; 


a) W XY2-+xX 
b} UV WXY2Z+Xx+x+ 
c) XY 2+V 到 一 XZ 十 士 


10. a) 采用 后 级 ( 反 向 波兰 ) 表示 法 编写 下 面 的 等 式 ， 注 意 算术 运算 符 的 优先 规则 ! 


和 一 有 十 CX(DDX 匹 一 天 ) 
G+HXK 


b) 利用 一 台 堆 栈 体系 结构 、0 地 址 指令 (只 有 pop 和 push 指令 可 以 访问 内 存 ) 的 计算 机 ， 编 写 一 段 
程序 对 是 上 面 算术 表达 式 进 行 估 值 。 


X= 


11. a) 如 果 某 台 计算 机 的 指令 格式 为 : 指令 的 长 度 共 11 位 ， 而 地 址 域 的 大 小 占 4 位 。 试 证 明 采 用 这 种 指 


令 格 式 的 计算 机 是 和 否 可 能 有 如 下 的 指令 形式 ， 并 验证 你 的 答案 ; 
5 个 2 地 址 指令 
45 个 1 地 址 指令 
32 个 0 地 址 指令 
b) 假如 某 台 采用 上 述 指令 格式 的 计算 机 体系 结构 ， 并 设计 了 6 个 2 地 址 指令 和 24 个 0 地 址 指令 。 试 问 
可 以 在 该 指令 系统 中 添加 的 1 地 址 指令 的 最 大 数目 是 多 少 ? 


12. 直接 寻 址 和 间接 寻 址 有 何 区别 ， 并 举 一 例 说 明 。 
令 13. 如 果 有 指令 Load 1000， 并 且 已 知 存储 器 和 寄存 器 R1 中 包含 如 下 数值 : 
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14. 如 果 有 指令 Load 500， 已 知 存储 器 和 寄存 器 R1 中 包含 如 下 数值 : 
存储 器 





全 
700 Wa a 


假定 R1 隐 含 在 变 址 寻 址 方式 中 ， 试 确定 指令 装 人 到 累加 器 中 实际 数值 ， 并 填写 下 表 : 





15. 已 知 在 某 个 非 流水 线 系统 中 处 理 一 项 任务 需要 200ns。 现 在 将 相同 的 任务 放 到 一 个 时 钟 周期 为 40ns 的 5 
级 流水 线 体系 结构 上 进行 处 理 。 求 出 对 于 处 理 200 项 任务 该 流水 线 可 以 获得 的 加 速 比 。 比 较 非 流 水 线 
单元 ， 该 流水 线 单 元 可 以 提升 的 最 大 加 速 比 是 多 少 ? 

16. 已 知 在 某 个 非 流 水 线 系统 中 处 理 一 项 任务 需要 100ns。 现 在 将 相同 的 任务 放 到 一 个 时 钟 周期 为 20ns 的 5 
级 流水 线 体系 结构 上 进行 处 理 ; 求 出 对 于 处 理 100 项 任务 该 流水 线 可 以 获得 的 加 速 比 。 比 较 非 流 水 线 
单元 ， 该 流水 线 单元 可 以 获得 的 理论 上 的 加 速 比 是 多 少 ? 

17. 编写 程序 代码 ， 分 别 在 3 地 址 、2 地 址 、1 地 址 和 0 地 址 计算 机 上 实现 表达 式 A=(B 二 C)X (D+E)。 
根据 编程 语言 的 惯例 ， 计 算 表达 式 时 不 应 该 改变 表达 式 中 各 个 操作 数 的 数值 。 

多 18. 某 个 数字 计算 机 的 存储 器 单元 的 每 个 字 具 有 24 位 长 度 。 该 计算 机 的 指令 系统 包含 150 个 不 同 的 操作 。 





19. 


20， 


x* 21, 
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所 有 的 指令 都 有 一 个 操作 代码 部 分 (操作 码 ) 和 一 个 地 址 部 分 (只 能 使 用 1 地 址 方式 )。 每 条 指令 都 
存储 在 内 存 的 一 个 字 中 。 请 回答 : 

令 a) 操作 码 需要 多 少 位 ? 

争 b) 指令 的 地 址 部 分 还 留 有 多 少 位 ? 

争 c) 可 使 用 的 最 大 存储 器 数量 是 多 少 ? 

令 d) 在 一 个 存储 器 字 中 可 以 容纳 的 最 大 无 符号 二 进 制 数 是 多 少 ? 

已 知 一 台 计算 机 的 存储 器 为 256KB 字 ， 每 个 字 字 长 为 32 位 。 计 算 机 的 指令 格式 具有 4 个 区 域 : 代码 
域 ， 模 式 域 ， 指 定 第 1 到 第 7 种 寻 址 方式 ;寄存 器 域 ， 指 定 第 1 到 第 60 个 寄存 器 ， 存储器 地 址 域 。 假 
定 一 条 指令 的 长 度 为 32 位 。 试 回答 下 列 问题 ; 

a) 模式 域 必须 有 多 大 ? 

b) 寄存 器 域 必须 有 多 大 ? 

c) 地 址 域 必须 有 多 大 ? 

d) 操作 码 域 必须 有 多 大 ? 

假设 在 某 个 非 流 水 线 体系 结构 的 机 器 上 ， 一 条 指令 的 执行 需要 4 个 时 钟 周期 。 其 中 : 一 个 时 钟 周期 取 
指 ， 一 个 时 钟 周期 译 码 ， 一 个 时 钟 周 期 执行 算术 逻辑 单元 (ALU) 的 操作 ， 以 及 一 个 时 钟 周期 存储 结 
果 。 在 一 个 具有 4 级 流水 线 体 系 结构 的 CPU 中 ， 该 指令 的 执行 仍 需 4 个 时 钟 周期 ， 那 么 流水 线 体 系 结 
构 到 底 该 如 何 来 加 速 程序 的 执行 ? 

任意 选取 一 种 计算 机 体系 结构 〈 不 属于 本 章 内 容 所 介绍 的 体系 结构 ) 。 研 究 并 找 出 这 种 计算 机 体系 结构 
是 如 何 来 处 理 本 章 所 引入 的 一 些 基本 概念 ， 正 如 Intel 体系 结构 、MIPS 体系 结构 和 Java 体系 结构 所 揭 
示 的 那样 。 


是 非 题 


1. 


2. 


大 多 数 计算 机 通常 可 以 归纳 为 以 下 三 种 CPU 组 织 结构 : (1) 通用 寄存 器 组 织 结构 ; 〈2) 单 累加 器 组 织 
结构 ;(3〉 堆栈 组 织 结构 。 
0 地 址 指令 计算 机 的 优点 是 它们 可 以 有 较 短 的 程序 ;缺点 是 它们 的 指令 需要 许多 位 ， 这 使 指令 变 得 很 长 。 





RAM/ 缩 写 词 /: 永远 都 不 够 用 的 存储 器 

因为 计算 机 配置 的 存储 器 越 多 ， 产 生 错 误 消 息 的 速度 就 越 快 。 
-一 -无名氏 

640KB 的 存储 器 应 该 对 任何 人 都 足够 了 。 

一 一 比尔 ，。 盖 蒋 〈Bill Gates) 


第 6 章 人 存 储 器 
6.1 概述 


当今 世界 上 大 多 数 的 计算 机 都 是 采用 冯 。 诺 伊 曼 模型 建造 的 ， 这 种 计算 机 体系 结构 的 核心 就 是 存 
储 器 。 计 算 机 需要 将 执行 各 种 任务 的 程序 存放 在 存储 器 中 。 在 第 3 章 中 ， 读 者 学 习 了 一 个 小 型 的 4X3 
位 的 存储 器 ， 并 在 第 4 章 和 第 5 章 中 学 习 了 如 何 对 存储 器 进行 编 址 。 从 逻辑 上 来 说 ， 存 储 器 的 存储 单 
元 是 按照 线 列 排列 的 ， 存 储 器 单元 的 地 址 从 0 开始 编 址 ， 直 到 处 理 器 可 以 寻 址 的 最 大 容量 。 本 章 将 讨 
论 各 种 类 型 的 存储 器 ， 以 及 它们 如 何 组 成 计算 机 中 不 同 层次 的 存储 器 系统 。 然 后 介绍 高 速 缓存 他 储 器 ， 
一 种 特殊 的 高 速 存储 器 。 最 后 ， 讨 论 一 种 最 大 限度 地 有 效 使 用 存储 器 的 方法 ， 即 通过 分 页 的 管理 机 人 制 
来 实现 虚拟 存储 器 。 


6.2 存储 器 的 类 型 


人 们 常常 会 提出 这 样 的 问题 :“ 为 什么 有 那么 多 不 同类 型 的 计算 机 存储 器 ?”。 我 们 对 这 个 问题 的 回 
答 是 ， 计 算 机 的 快速 发 展 使 得 CPU 的 设计 不 断 获 得 改进 ， 而 要 求 与 之 配套 的 存储 器 必须 在 速度 上 与 
CPU 的 发 展 保持 同步 。 然 而 存储 器 已 经 成 为 计算 机 技术 发 展 中 的 一 个 瓶颈 问题 。 虽 然 在 过 去 的 几 年 
中 ，CPU 的 技术 取得 了 重大 进步 ， 但 由 于 采用 了 高 速 缓存 存储 器 的 技术 ， 所 以 改进 主 存储 器 以 便 与 
CPU 匹配 的 要 求 ， 实 际 上 已 经 不 像 以 往 那 么 急迫 。 高 速 缓存 存储 器 是 一 种 小 容量 、 高 速度 ， 同 时 也 是 
高 价格 的 存储 器 。 高 速 缓存 的 作用 是 在 频繁 存 取 数据 的 过 程 中 充当 一 个 缓冲 器 。 内 为 高 性 能 的 高 速 绥 
存 存储 器 系统 常常 会 掩盖 掉 较 慢 速度 的 存储 器 系统 的 作用 ， 所 以 人 们 并 不 总 是 能 够 正确 地 判断 使 用 高 
速 缓存 存储 器 这 种 技术 所 需要 付出 的 额外 开销 。 因 此 ， 在 讨论 高 速 缓存 存储 器 之 前 ， 首 先 介 绍 各 种 不 
同 的 存储 器 技术 。 

尽管 存储 器 技术 类 型 繁多 ， 但 是 大 部 分 计算 机 系统 都 使 用 两 种 基本 类 型 的 存储 器 : 随机 存储 器 
(random access memory，RAM) 和 只 读 存储 器 (read-only memory，ROM) 。RAM 一 词 在 这 里 有 些 用 
词 不 当 ， 更 合适 的 名 字 是 读 写 〈read-write) 存储 器 。RAM 是 计算 机 规格 说 明 中 给 出 的 存储 器 。 如 果 
用 户 购买 的 计算 机 规格 标明 是 128MB 字 节 的 存储 器 ， 即 表示 这 台 计 算 机 具有 128MB 的 RAM。 同 时 ， 
RAM 也 就 是 在 本 书 的 始终 不 断 提 及 的 “ 主 存储 器 (main memory， 或 称 为 primary memory)”。 在 计算 
机 执行 程序 时 ，RAM 用 来 存放 程序 或 数据 。 但 是 ，RAM 是 一 种 易 失 性 的 存储 器 。 当 存储 器 系统 掉 电 
时 ，RAM 中 所 存储 的 信息 会 丢失 。 现 在 的 计算 机 系统 一 般 都 采用 两 种 类 型 的 存储 器 改 片 来 构建 大 规 
模 的 RAM 存储 器 : 静态 随机 存储 器 (SRAM) 和 动态 随机 存储 器 (DRAM)。 

动态 RAM 由 一 个 小 电容 构建 而 成 。 由 于 电容 会 泄漏 电荷 ， 所 以 DRAM 需要 每 隔 儿 个 讲 秒 充电 才 
能 保存 数据 。 相 比 之 下 ， 静 态 RAM 技术 只 要 电源 供电 不 断 ， 就 可 以 维持 它 所 保存 的 数据 。SRAM 由 
类 似 于 第 3 章 中 介绍 的 D 触发 器 的 电路 组 成 。SRAM 的 速度 比 DRAM 更 快 ， 但 价格 更 高 。 设 计 人 员 
使 用 DRAM 的 原因 是 因为 DRAM 的 存储 密度 更 高 〈 即 单 块 芯片 上 可 以 存储 更 多 的 位 数 )， 消 耗 的 功 耗 
更 低 ， 比 SRAM 产生 的 热量 要 小 得 多 。 鉴 于 上 述 理由 ， 通 常 使 用 两 种 技术 的 组 合 形式 ，DRAM 用 作 
主 存 储 器 ，SRAM 用 作 高 速 缓存 存储 器 。 所 有 DRAM 的 基本 操作 都 是 相同 的 ， 但 是 DRAM 还 是 可 以 
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分 成 许多 类 型 ， 包 括 多 层 结构 的 DRAM (MDRAM)、 人 快速 翻 页 模式 (FPM) 的 DRAM、 扩 展 数 据 输 
出 《EDO) 的 DRAM、 并 发 EDO DRAM、 同 步 动 态 随 机 存储 器 (SDRAM)、 同 步 连接 的 〈SL) 
DRAM、 双 倍数 据 传送 率 的 (DDR) SDRAM， 以 及 直接 RAM 总 线 的 (DR) DRAM 等 。 而 SRAM 
也 可 以 划分 成 各 种 不 同 的 类 型 : 异步 SRAM、 同 步 SRAM 和 流水 线 并 发 体系 结构 的 SRAM 等。 要 了 
解 有 关 存 储 器 类 型 的 更 多 信息 ， 可 以 阅读 本 章 结尾 列 出 的 参考 文献 。 

除了 RAM 存储 器 外 ， 大 部 分 计算 机 系统 还 使 用 一 定数 目的 ROM 存储 器 (只 读 存储 器 ) 来 存放 一 
些 运行 计算 机 系统 所 需要 的 关键 信息 ， 比 如 启动 计算 机 系统 所 需要 的 程序 。ROM 属于 非 易 失 性 的 存储 
器 ， 可 以 长 久保 持 它 所 存放 的 数据 。 这 种 类 型 的 存储 器 也 应 用 于 给 人 式 系 统 或 是 一 些 编程 无 需 改变 的 系 
统 中 。 许 多 家 用 电器 、 玩 具 和 大 部 分 的 汽车 都 使 用 ROM 芯片 ， 在 电源 关闭 后 还 可 以 保存 其 中 的 信息 。 
ROM 存储 器 也 广泛 地 应 用 于 计算 器 和 某 些 外 围 设备 中 ， 例 如 激光 打印 机 采用 ROM 保存 打印 字符 的 点 
阵 。 有 5 种 不 同类 型 的 基本 ROM 存储 器 : ROM、PROM、EPROM、EEPROM 和 闪存 (flash memory) 。 
PROM 称 为 可 编程 只 读 存 储 器 ， 它 是 ROM 的 一 种 改进 类 型 。 用 户 可 以 使 用 专门 的 设备 对 PROM 进行 纺 
程 。 由 于 ROM 采用 的 是 硬 连 线 ，PROM 存储 器 中 有 许多 熔断 丝 ， 可 以 通过 烧 断 的 方法 来 对 芯片 进行 纺 
程 。 但 是 ， 一 旦 编程 完成 ，PROM 中 的 数据 和 指令 都 不 能 再 更 改 。EPROM 为 可 擦 除 PROM， 是 一 种 可 
以 重复 编程 的 可 编程 存储 器 。 擦 除 EPROM 需要 有 一 个 可 以 发 射 紫外 线 的 特殊 工具 。 要 对 EPROM 进行 
再 编程 ， 首 先 需 要 将 整 块 芯片 中 的 原 有 信息 擦 除 干净 。EEPROM 是 电 可 擦 除 PROM， 它 克服 了 EPROM 
的 许多 缺点 : 芯片 上 的 信息 擦 除 只 需要 施加 一 个 电场 ， 而 无 需 特殊 的 擦 写 工 具 ; 并 且 可 以 只 擦 除 蕊 片上 
某 些 部 分 的 信息 ， 例 如 一 次 只 氛 除 一 个 字 节 。 闪 存 本 质 上 也 是 一 种 EEPROM。 但 是 内 存 的 优点 是 可 以 按 
块 来 擦 写 数据 ， 而 不 限于 每 次 只 能 擦 写 一 个 字 节 。 因 此 ， 闪 存 的 擦 写 速度 要 比 EEPROM 快 。 


6.3 存储 器 的 层次 结构 


要 理解 现代 处 理 器 性 能 ， 其 中 一 个 最 重要 的 考虑 因素 就 是 存储 器 组 成 的 层次 结构 。 正 如 前 面 所 见 ， 
各 种 存储 器 的 性 能 有 很 大 的 差别 。 虽 然 某 些 类 型 的 存储 器 存储 效率 比较 低 ， 但 是 价格 却 非常 便宜 。 为 
了 应 对 这 种 差异 ， 能 够 达到 最 佳 的 性 价 比 ， 当 今 的 计算 机 系统 都 采用 各 种 不 同类 型 的 存储 器 的 组 合 配 
置 。 这 种 方案 称 为 存储 器 分 层 结构 〈hierarchical memory) 。 通 常 存储 器 的 速度 越 快 ， 单 位 信息 存储 的 
成 本 也 越 高 。 通 过 采用 存储 器 的 分 层 组 织 结 构 ， 使 不 同 层次 的 存储 器 具有 不 同 的 访问 速度 (或 称 为 存 
' 取 速度 ) 和 存储 容量 。 计 算 机 系统 也 可 以 由 此 获得 比 那些 不 采用 各 类 存储 器 组 合 的 系统 更 好 的 性 能 。 
通常 ， 存 储 器 分 层 结构 系统 的 基本 类 型 包括 : 寄存 器 、 高 速 缓存 、 主 存储 器 和 辅助 存储 器 。 

现代 计算 机 一 般 都 具有 一 个 数目 较 小 的 高 速 存 储 器 系统 ， 称 为 高 速 缓 在。 高速 缓存 用 来 暂时 存放 
一 些 存储 器 单元 中 频繁 使 用 的 数据 。 这 种 高 速 缓存 会 被 连接 到 一 个 容量 较 大 的 主 存储 器 。 通 常 主 存 储 
器 的 速度 中 等 。 然 后 再 使 用 一 个 容量 非常 大 的 辅助 存储 器 作为 机 器 存储 器 系统 的 补充 。 这 种 辅助 存储 
器 系统 一 般 由 硬盘 和 一 些 可 移动 的 存储 介质 组 成 。 采 用 这 种 存储 器 分 层 结构 的 组 织 方式 ， 可 以 提高 对 
存储 器 系统 的 有 效 访 问 速度 ， 而 且 只 需 使 用 少量 快速 (并 且 非 常 昂贵 ) 的 芯片 。 这 样 设计 人 员 可 以 用 
一 个 合理 的 价格 来 创建 具有 满意 性 能 的 计算 机 系统 。 

我 们 通常 可 以 按照 存储 器 离开 处 理 器 的 上 距离 (distance) 来 对 存储 器 分 类 ， 这 种 距离 按照 访问 存储 
器 所 需要 的 机 器 周期 数目 来 测量 。 距 离 处 理 器 最 近 的 存储 器 ， 肯 定 是 最 快 的 存储 器 。 随 着 存储 器 离开 
主 处 理 器 距离 的 增加 ， 访 问 这 些 存储 器 的 时 间 也 会 变 长 。 因 此 ， 较 慢 的 存储 器 技术 用 于 距离 处 理 器 较 
远 的 存储 器 系统 ， 而 较 快 的 存储 器 技术 用 于 靠近 CPU 的 存储 器 系统 。 通 常 ， 存 储 器 的 技术 越 好 ， 访 问 
存储 器 的 速度 也 就 越 快 ， 但 是 存储 器 的 成 本 也 会 变 得 越 昂贵 。 也 就 是 说 ， 由 于 价格 的 因素 ， 倾 向 于 速 
度 快 的 存储 器 的 使 用 数量 比 速度 慢 的 存储 器 要 少 。 

在 讨论 存储 器 层次 结构 时 ， 会 涉及 下 面 的 一 些 基 本 术语 ， 

。 命 中 〈hit) 一 CPU 请 求 的 数据 就 驻 留 在 要 访问 的 存储 器 层 中 。 通 常 ， 只 是 在 存储 器 的 较 高 层 上 

才 会 关心 所 谓 命 中 率 的 问题 。 
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“缺失 (miss) 一 CPU 请 求 的 数据 不 在 要 访问 的 存储 器 层 。 

“命中 率 〈hit rate) 一 访问 某 个 特定 的 存储 器 层 时 ，CPU 找到 所 需 数据 的 百分比 。 

。 缺 失 率 ， 又 称 为 未 命中 率 (miss rate) 一 访问 某 个 特定 的 存储 器 层 时 ，CPU 找 不 到 所 需 的 数据 

百分比 。 注 意 : 缺失 率 王 1 一 命中 率 。 

“命中 时 间 (hit time) 一 在 某 个 特定 的 存储 器 层 中 ，CPU 取得 所 请 求 的 信息 需要 的 时 间 。 

*“ 缺失 损失 (miss penalty) 一 CPU 处 理 一 次 缺失 事件 所 需要 的 时 间 ， 其 中 包括 利用 新 的 数据 取代 

上 层 存储 器 中 的 某 个 数据 块 所 需要 的 时 间 ， 再 加 上 将 所 需 数据 传递 给 处 理 器 所 需要 的 附加 时 间 。 

通常 情况 下 ， 处 理 一 次 缺失 事件 所 花费 的 时 间 要 比 处 理 一 次 命中 所 需要 的 时 间 更 多 。 

存储 器 的 层次 结构 如 图 6-1 所 示 。 图 中 的 金字 塔 结构 表示 不 同 的 存储 器 容量 的 相对 大 小 。 靠 近 金 
字 塔 顶部 〈 也 就 是 比较 靠近 CPU) 的 存储 器 一 般 规模 较 小 。 但 是 ， 与 靠近 金字 塔 较 底层 的 存储 器 相 比 
较 ， 这些 较 小 规模 的 顶层 存储 器 的 性 能 更 好 ， 但 价格 也 更 昂贵 (针对 存储 器 的 每 位 的 单位 成 本 而 言 )。 
图 中 金字 塔 左边 的 数字 表示 CPU 访问 相应 的 存储 器 层 通 常 所 需要 的 时 间 。 


成 本 较 高 










访问 时 间 
lns -2ns 
3ns -10ns 


100ms -> 5S” 
10s =» 3m° 


“如 果 卷 已 安装 。 


图 6-1 存储 器 的 层次 结构 


对 于 任何 给 定数 据 ， 处 理 器 首先 将 访问 数据 的 请 求 传送 给 存储 器 中 速度 最 快 ， 规 模 最 小 的 存储 器 
层 。 通 常 是 高 速 缓存 存储 器 ， 而 不 是 寄存 器 ， 原 因 是 寄存 器 通常 会 用 于 更 专用 的 用 途 。 如 果 在 高 速 组 
存 中 找到 所 需 的 数据 ， 这 些 数据 就 会 很 快 地 被 装 和 人 CPU 的 寄存 器 中 。 如 果 数 据 没有 驻 留 在 高 速 缓存 
中 ， 那 么 访问 数据 的 请 求 就 会 被 传送 到 下 一 个 较 低 层次 的 存储 器 系统 ， 继 续 开始 数据 的 搜索 任务 。 如 
果 在 这 一 层 的 存储 器 中 找到 所 需 的 数据 ，CPU 会 将 数据 所 在 整个 字 块 的 内 容 转移 到 高 速 缓存 中。 如果 
在 这 一 层 的 存储 器 系统 中 没有 找到 所 需 数据 ， 那 么 搜索 数据 的 请 求 又 会 继续 传送 到 下 一 个 更 低层 的 存 
储 器 系统 ， 依 此 类 推 。 这 里 我 们 要 强调 的 核心 思想 是 ， 较 低层 (显然 也 是 速度 较 慢 ， 规 模 较 大 和 价格 
较 便 宜 ) 的 存储 器 系统 会 响应 较 高 层 的 存储 器 对 位 于 存储 器 单元 X 处 的 数据 请 求 。 同 时 ， 这 些 低层 存 
储 器 也 会 将 位 于 地 址 X 十 1，X 十 2，…， 处 的 数据 送出 ， 也 就 是 将 整个 数据 块 返回 较 高 层 的 存储 器 系 
统 。 这 样 做 的 目的 是 希望 这 些 返回 的 多 余数 据 会 在 不 久 的 将 来 被 调用 。 事 实 上 ， 在 大 多 数 时 间 ， 人 情况 
的 确 如 此 。 存 储 器 的 分 层 组 织 结构 的 确 非 常 有 效 ， 因 为 计算 机 的 程序 都 具有 “局 部 性 ”的 特性 。 这 种 
局 部 性 的 特点 是 允许 处 理 器 可 以 访问 从 地 址 X 十 1，X 十 2 等 处 返回 的 数据 。 这 样 一 来 ， 即 使 发 生 某 次 
缺失 事件 ， 例 如 高 速 缓存 的 X 单元 。 但 由 于 程序 具有 局 部 性 的 特征 ，CPU 可 能 会 对 新 近 返 回 的 整个 数 
据 块 产生 几 次 高 速 缓存 命中 。 


引用 的 局 部 性 
通常 ， 处 理 器 倾向 于 以 一 种 非常 规范 的 方式 访问 存储 器 。 例 如 ， 如 果 没 有 分 支 转移 ， 在 MARIA 
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中 的 程序 计数 器 (PC) 会 在 每 次 提取 一 条 指令 后 自动 增 量 加 1。 因 此 ， 如 果 处 理 器 在 t 时 刻 访问 了 在 
储 单元 XX， 那么 在 不 久 的 将 来 访问 存储 单元 X 十 1 的 可 能 性 会 非常 高 。 计 算 机 程序 对 存储 器 的 引用 常 
常会 有 集中 成 组 成 久 的 形式 ， 这 就 是 引用 的 局 部 性 (locality of reference) 的 一 个 例证 。 通 过 对 存储 器 
实现 分 层 结构 的 管理 可 以 很 好 地 利用 这 种 局 部 性 的 优点 。 在 处 理 某 个 缺失 事件 时 ， 处 理 器 不 是 简单 地 
将 所 要 搜索 的 数据 传递 给 较 高 层 的 存储 器 ， 而 是 将 包含 该 数据 的 整个 数据 块 全 部 返回 。 由 于 引用 的 局 
部 性 特性 ， 同 时 返回 的 额外 数据 很 有 可 能 在 不 久 的 将 来 被 引用 。 如 果 确 实 需要 这 些 数据 ， 那 么 它们 就 
会 被 从 较 快 的 存储 器 中 很 快 地 装 人 到 CPU 中 。 

引用 的 局 部 性 有 下 面 三 种 基本 形式 : 

。 时 间 局 部 性 《Temporal locality) ， 最近 访问 过 的 内 容 很 可 能 在 不 久 的 将 来 再 次 被 访问 。 

。 空间 局 部 性 〈Spatial locality) ， 对 存储 器 地 址 空间 的 访问 形成 团 簇 的 集中 倾向 〈 例 如 ， 在 数组 或 

循环 操作 中 ) 。 

。 顺序 局 部 性 〈Sequential locality): 访问 存 取 器 的 指令 倾向 于 按 顺 序 执行 。 

这 种 局 部 性 的 原理 使 系统 有 机 会 使 用 少量 速度 非常 快 的 存储 器 来 有 效 加 速 对 系统 中 主要 存储 器 的 
访问 。 通 常 ， 在 任意 给 定时 刻 计算 机 系统 只 需要 访问 整个 存储 空间 中 的 某 一 个 非常 小 的 部 分 ， 而 且 存 
放 在 该 位 置 的 数值 常常 会 被 重复 读 取 。 因 此 ， 可 以 将 这 些 数值 从 一 个 访问 速度 较 慢 的 存储 器 复制 到 一 
个 容量 较 小 、 速 度 很 快 且 驻 留 在 较 高 层 的 存储 器 中 。 利 用 这 种 方式 组 织 的 存储 器 系统 可 以 将 大 量 的 信 
息 存 储 在 一 个 巨大 的 、 低 成 本 的 存储 器 中 。 同 时 ， 却 可 以 获得 与 使 用 速度 很 快 ， 但 是 价格 昂贵 的 存储 
器 几乎 相同 的 访问 速度 。 


6.4 高 速 缓 存 存储 器 


计算 机 的 处 理 器 速度 非常 快 ， 并 且 需 要 不 断 地 从 存储 器 读 取 信息 。 由 于 存储 器 的 访问 时 间 比 处 理 
器 的 速度 慢 ， 这 样 就 造成 了 处 理 器 需要 等 待 存储 器 中 信息 的 到 达 。 高 速 缓存 存储 器 是 一 种 规模 很 小 ， 
但 速度 很 快 的 存储 器 。 处 理 器 利用 高 速 缓存 临时 存放 一 些 即将 需要 的 信息 。 

在 现实 生活 中 ， 有 关 非 计算 机 的 高 速 缓 存 的 例子 比比 丝 是 。 提 及 这 些 例子 将 有 助 于 理解 计算 机 高 
速 缓存 存储 器 的 工作 原理 。 我 们 设想 某 个 房屋 的 屋 主 在 车 库 里 面 有 一 个 很 大 的 工具 箱 。 假 如 你 就 是 房 
屋 的 屋 主 ， 并 且 要 在 地 下 室 进行 一 项 房屋 改造 工程 。 这 项 改造 工程 需要 使 用 各 种 工具 : 如 电钻 、 扳 手 、 
锤子 、 卷 信 、 几 把 不 同 规格 的 锯 ， 以 及 各 种 不 同类 型 和 大 小 的 螺丝 起 子 。 现 在 ， 首 先 要 测量 和 锯 一 些 
木头 。 你 先 跑 到 车 库 ， 从 一 个 巨大 的 工具 箱 中 取出 一 把 卷 尺 。 然 后 ， 跑 到 地 下 室 去 测量 木头 。 之 后 ， 
跑 回 车 库 把 卷 尺 放 回 工具 箱 ， 又 拿 起 一 把 锯 返 回 地 下 室 去 锯 木 头 。 随 后 ， 你 决定 将 一 些 木 块 固定 推 在 
一 起 。 于 是 ， 你 又 到 车 库 工 具 箱 中 找 出 电钻 和 钻头 ， 回 到 地 下 室 给 木 块 钴 孔 ， 并 将 螺栓 穿 在 孔 中 。 然 
后 返回 车 库 将 电钻 放 好 ， 顺 手 拿 起 一 把 扳手 ， 跑 回 地 下 室 。 结 果 却 发 现 拿 来 的 扳手 尺寸 规格 不 对 ， 于 
是 又 得 返回 车 库 ， 从 工具 箱 中 拿 来 另外 一 把 扳手 ……， 你 真 的 要 如 此 地 进行 工作 吗 ? 当然 不 是 ! 作为 
一 个 有 头脑 的 人 ， 你 也 许 会 做 出 某 些 思考 :“ 如 果 现 在 需要 使 用 某 把 扳手 的 话 ， 也 许 很 快 就 会 要 用 到 另 
外 一 把 不 同 尺 寸 的 扳手 ， 所 以 为 什么 不 将 整套 扳手 都 拿 到 地 下 室 呢 ?”。 于 是 ， 你 会 做 进一步 思考 并 推 
断 :“ 如 果 现 在 需要 使 用 某 种 工具 的 话 ， 很 有 可 能 很 快 就 会 用 到 另外 的 一 种 工具 ， 为 什么 不 准备 一 个 小 
的 工具 箱 带 到 地 下 室 去 呢 ?”。 这 样 一 来 ， 可 以 将 一 些 急需 的 工具 放 在 手边 ， 用 起 来 就 会 快 得 多 。 实 际 
上 ， 在 这 里 已 经 应 用 了 高 速 缓存 的 思想 ， 存 放 了 一 些 工 具 在 手边 ， 可 以 使 拿 取 工具 时 更 方便 、 快 捷 。 
而 不 太 可 能 使 用 的 工具 仍然 保留 在 某 个 较 远 的 地 方 〈 例 如 ， 车 库 的 大 工具 箱 中 ) ， 拿 取 它 们 需要 花费 更 
多 的 时 间 。 这 也 正 是 计算 机 的 高 速 缓存 存储 器 所 要 做 的 事情 : 计算 机 会 将 已 经 访问 过 的 和 CPU 可 能 将 
要 访问 的 数据 存放 在 一 个 速度 较 快 的 、 比 较 靠近 CPU 的 高 速 缓存 存储 器 中 。 

另外 一 个 有 关 高 速 缓存 的 类 似 例 子 是 去 商店 购物 。 通 常情 况 下 ， 人 们 去 杂货 店 不 大 可 能 只 购买 一 
件 物 品 。 可 能 会 买 一 些 马上 要 用 的 物品 ， 或 一 些 将 来 可 能 要 用 的 物品 。 商 店 就 像 计 算 机 系统 中 的 主 存 
储 器 ， 而 你 的 家 就 相当 于 高 速 缓存 存 储 器 。 下 面 再 举 一 个 相关 的 例子 : 大 家 想 一 想 有 多 少 人 会 带 着 一 
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整 本 厚 厚 的 电话 号 码 敌 到 处 走 来 走 去 呢 ? 相反 ， 大 部 分 人 都 是 随身 携带 一 个 小 的 电话 本 ， 上 面 记录 了 
一 些 可 能 经 常 联络 的 人 员 的 姓名 和 电话 号 码 。 在 小 电话 本 上 查找 某 个 电话 号 码 比 在 一 个 大 电话 号 码 鲁 
上 先 查找 姓名 ， 再 获取 电话 号 码 显然 要 快 得 多 。 人 们 通常 会 将 小 电话 本 随身 携带 ， 而 把 大 电话 短 留 在 
家 里 ， 放 在 家 中 的 茶几 、 书 架 或 者 是 其 他 的 地 方 。 电 话 簿 一 般 不 会 经 常 使 用 ， 可 以 放 在 某 个 不 显眼 的 
地 方 。 与 大 电话 德 相 比 ， 电 话 本 的 “存储 容量 ”要 小 得 多 。 但 是 当 打 电话 时 ， 却 发 现在 小 电话 本 上 找 
到 所 需 电话 号 码 的 几率 非常 高 。 

学 生 们 在 撰写 研究 工作 报告 时 也 会 过 到 有 关 高 速 缓存 的 例子 。 假 设 你 正在 书写 一 篇 有 关 量 子 计算 
的 论文 。 不 知 你 是 否 愿意 采取 这 样 的 方式 来 进行 这 项 研究 工作 ， 先 到 图 书馆 ， 去 查阅 某 本 书籍 ， 获 取 
一 些 有 用 的 信息 资料 带 回 家 中 ; 然后 ， 又 去 图 书馆 查阅 另外 -一 本 书 ， 再 返回 家 中 继续 写作 ; 如 此 往复 ? 
答案 肯定 是 否定 的 。 而 我 们 通常 会 采取 的 方法 是 : 到 图 书馆 去 查阅 所 有 可 能 需要 的 书籍 ， 然 后 将 这 些 
书籍 都 带 回 家 。 图 书馆 就 好 比 是 主 存储 器 ， 而 家 则 相当 于 高 速 缓存 存储 器 。 

作为 高 速 缓存 的 最 后 一 个 例子 ， 读 者 可 以 想像 一 下 本 书 其 中 的 某 位 作者 会 怎样 使 用 她 的 办 公 室 。 
她 会 将 不 需要 的 资料 ， 或 者 在 六 个 月 内 不 会 使 用 的 资料 ， 放 在 一 边 ， 收 藏 在 一 组 大 的 文件 柜 里 面 。 而 
把 那些 需要 经 常 使 用 的 “数据 ”保留 下 来 ， 堆 放 在 办 公 桌 上 。 这 些 数据 就 在 手边 ， 很 方便 随时 查找 。 
当 和 需要 从 某 个 文件 中 取 一 些 资 料 时 ， 她 很 可 能 会 将 整个 文件 都 拿 出 来 ， 而 不 只 是 从 文件 夹 中 取出 一 、 
二 篇 论文 。 这 时 ， 取 出 来 的 整个 文件 都 会 被 加 入 到 办 公 桌 上 的 文件 堆 中 去 。 显 然 ,文件 柜 成 了 作者 的 
“ 主 存储 器 ”， 而 办 公 桌 〈 桌 上 放 了 许多 随意 堆放 的 文件 ) 就 是 高 速 缓存 存储 器 。 

高 速 缓存 存储 器 的 基本 工作 原理 与 前 面 所 列举 的 例子 基本 类 似 。 计 算 机 系统 会 将 那些 需要 频繁 使 
用 的 数据 复制 到 高 速 缓存 存储 器 中 ， 面 不 是 通过 直接 访问 主 存储 器 来 重新 获取 数据 。 高 速 缓存 存储 器 
中 的 内 容 既 可 以 是 没有 组 织 好 的 ， 就 像 作者 办 公 桌 上 未 整理 好 的 文件 ; 也 可 以 是 组 织 有 序 的 ， 就 如 同 
电话 本 中 的 内 容 一 样 。 但 是 ， 无 论 采 取 何 种 组 织 方式 ， 高 速 缓存 中 的 数据 都 必须 是 可 以 访问 的 ， 也 就 
是 可 以 对 数据 进行 定位 查找 。 计 算 机 中 的 高 速 缓存 存储 器 与 现实 生活 中 的 例子 之 间 存 在 的 一 个 最 大 的 
不 同 是 ， 计算 机 没有 办 法 ， 或 者 是 通过 某 种 推理 〈a priori) 知道 哪些 数据 是 最 有 可 能 被 计算 机 访问 读 
取 的 。 因 此 ， 计 算 机 需要 使 用 局 部 性 原理 ， 在 访问 主 存储 器 时 会 将 整个 数据 块 从 主 存储 器 中 复制 到 高 
速 缓存 存储 器 。 如 果 被 传递 的 数据 块 中 有 某 些 数据 的 使 用 率 很 高 ， 那 么 整 块 数据 的 转移 就 会 节省 大 量 
的 存储 器 访问 时 间 。 高 速 缓存 对 这 种 新 数据 块 的 定位 操作 取决 于 两 个 因素 : 高速 缓存 的 映射 策略 和 高 
速 缓存 的 大 小 。 高 速 缓存 的 映射 策略 将 在 下 一 节 讨 论 ， 而 高 速 缓存 的 大 小 会 直接 影响 到 是 否 有 是 够 的 
空间 存放 新 的 数据 块 。 

对 于 不 同 的 计算 机 ， 高 速 缓存 存储 器 的 容量 有 很 大 的 差别 。 通 常 个 人 计算 机 的 第 二 级 (1.2) 高 速 
缓存 的 大 小 为 256KB 或 512KB。 而 第 一 级 〈(L1) 高 速 缓存 要 小 一 些 ， 通 常 为 8KB 或 16KB。L1 高 速 
缓存 通常 集成 在 微 处 理 嚣 中， 而 L2 高 速 缓存 则 位 于 CPU 和 主 存储 器 之 间 。 内 此 ，L1 高 速 缓存 要 比 
L2 高 速 缓存 的 速度 快 。 有 关 商 店 的 例子 可 以 说 明 L1 高 速 缓存 和 L2 高 速 缓存 之 间 的 相互 关系 : 如 果 将 
商店 当 作 主 存储 器 ， 那 么 可 以 把 家 里 的 冰箱 看 成 是 L2 高 速 缓存 ， 而 家 里 的 餐桌 可 以 当 作 LI 高 速 
缓存 。 

使 用 高 速 缓存 存储 器 的 目的 是 为 了 加 快 存 储 器 的 访问 速度 。 高 速 缓存 将 最 近 使 用 过 的 数据 存放 在 
靠近 CPU 的 地 方 ， 而 不 是 将 这 些 数据 存放 到 主 存储 器 中 。 员 然 高 速 缓存 的 容量 远 没 有 主 存储 器 大 ， 但 
其 速度 却 快 得 多 。 通 常 主 存储 器 由 DRAM 组 成 ， 其 单 次 访问 时 间 为 60ns; 而 高 速 缓存 由 SRAM 构成 ， 
比 DRAM 的 访问 速度 快 得 多 ， 访 问 周 期 也 短 得 多 。 通 常 高 速 缓存 存储 器 的 单 次 访问 时 间 为 10ns。 高 
速 缓存 存储 器 不 需要 规模 很 大 ， 就 可 以 获得 非常 优良 的 性 能 。 设 计 高 速 缓存 存储 器 的 基本 法 则 是 ; 既 
要 求 高 速 缓存 的 容量 尽量 小 ， 使 高 速 缓存 存储 器 每 位 的 总 平均 成 本 可 以 接近 于 主 存储 器 ;又 必须 保证 
高 速 缓存 的 容量 足够 大 ， 可 以 很 好 地 满足 系统 的 速度 要 求 。 由 于 快速 存储 器 的 价格 非常 昂贵 ， 所 以 目 
前 采用 高 速 缓存 存储 器 的 技术 来 创建 所 有 的 主 存储 器 是 不 切实 际 的 。 

到 底 高 速 缓存 存储 器 有 何 “ 特 殊 ” 之 处 ? 高 速 缓存 存储 器 并 不 通过 地 址 进行 访问 ， 而 是 按照 内 容 
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进行 存 取 。 基 于 这 种 原因 ， 高 速 缓存 存储 器 有 时 也 会 被 称 为 按 内 容 寻 址 的 存储 器 〈content addressable 
memory)， 或 简称 为 C4M。 在 大 部 分 高 速 缓存 映 射 策略 的 方案 中 ， 都 必须 检查 或 搜索 高 速 缓存 的 人 
口 ， 以 确定 所 需 的 数值 是 否 存放 在 高 速 缓存 中 。 为 了 简化 定位 搜索 所 需 数据 的 过 程 ， 不 同 的 高 速 缓存 
存储 器 采用 了 不 同 的 高 速 缓存 映射 算法 。 


6.4.1 高 速 缓存 的 映射 模式 


要 使 高 速 缓存 存储 器 发 挥 作用 ， 则 其 中 必须 存放 有 用 的 数据 。 然 而 ， 如 果 CPU 无 法 找到 这 些 数 据 ， 
那么 这 些 数据 也 就 变 成 了 无 用 的 数据 。 在 访问 数据 或 指令 时 ，CPU 首先 会 生成 一 个 主 存储 器 地 址 。 此 
时 ， 如 果 要 访问 的 数据 已 经 被 复制 到 高 速 缓存 中 ,那么 这 个 数据 在 高 速 缓存 中 的 地 址 与 主 存储 器 中 的 地 
址 不 同 。 例 如 ， 位 于 主 存 储 器 地 址 2E3 单元 中 的 数据 ， 可 能 会 被 存放 在 高 速 缓存 存储 器 中 非常 靠 前 的 某 
个 单元 中 。 现 在 的 问题 是 ， 当 数据 被 复制 到 高 速 缓存 存储 器 后 ，CPU 如 何在 高 速 缓存 中 定位 查找 出 这 些 
数据 ? CPU 会 采用 某 种 特殊 的 映射 模式 ， 将 主 存储 器 的 地 址 转换 为 一 个 对 应 的 高 速 缓存 存储 器 位 置 。 

我 们 可 以 通过 对 主 存储 器 地 址 的 各 个 位 规定 某 些 特殊 的 意义 来 实现 地 址 的 转换 。 首 先 将 地 址 的 二 
进 制 位 分 成 不 同 的 组 ， 称 为 域 。 根 据 映 射 模式 的 不 同 ， 主 存储 器 地 址 的 分 组 可 以 有 两 个 或 三 个 地 址 域 。 
至 于 具体 如 何 使 用 这 些 地 址 域 ， 取 决 于 所 采用 的 特定 的 映射 模式 。 高 速 缓存 的 映射 模式 决定 了 数据 最 
初 被 复制 到 高 速 缓存 存储 器 中 时 的 存放 位 置 ， 并 且 为 以 后 CPU 搜索 高 速 缓存 时 提供 了 一 种 查找 以 前 被 
复制 的 数据 的 方法 。 

在 讨论 映射 模式 之 前 ， 必 须 了 解数 据 是 如 何 被 复制 到 高 速 缓存 中 的 ， 这 一 点 非常 重要 。 主 存储 器 
和 高 速 缓存 的 存储 空间 都 会 被 划分 成 相同 大 小 的 字 块 〈 简 称 块 )， 不 同系 统 的 存储 块 的 大 小 可 能 有 所 不 
同 。 当 生成 一 个 存储 器 的 地 址 时 ，CPU 会 首先 搜索 高 速 缓存 存储 器 ， 查 找 所 要 求 的 数据 字 是 否 已 经 存 
放 在 高 速 缓存 中 。 如 果 在 高 速 缓存 中 没有 找到 所 要 求 的 字 ， 那 么 CPU 会 把 主 存储 器 中 该 字 所 在 位 置 的 
整个 块 装 人 到 高 速 缓存 存储 器 中 。 正 如 前 面 所 述 ， 由 于 局 部 性 原理 ， 这 种 方法 非常 成 功 。 如 果 一 个 数 
据 字 刚刚 被 引用 过 ， 那 么 在 同一 临近 区 域 的 数据 字 被 引用 的 几率 很 大 。 因 此 ，- -个 缺失 〈 未 命中 ) 的 
数据 字 常 常会 导致 查找 到 几 个 所 需 的 字 。 例 如 ， 在 地 下 室 中 工作 时 需要 一 些 工 具 ， 某 个 工具 可 能 没有 
找到 〈 称 为 一 次 缺失 )， 这 样 不 得 不 去 车 库 拿 取 。 在 车 库 里 面 ， 你 收集 了 一 组 可 能 需要 的 工具 返回 地 下 
室 ， 希望 在 地 下 室 进行 房 屋 改造 工程 时 可 以 找到 几 把 需要 的 工具 ( 即 几 次 命中 )， 而 无 需 多 次 到 车 库 里 
去 拿 取 。 因 为 访问 高 速 缓存 字 〈 相 当 于 某 种 工具 已 经 在 地 下 室 中 ) 要 比 访问 主 存储 器 字 (类 似 于 重新 
跑 回 到 车 库 中 ) 的 速度 快 得 多 ， 所 以 高 速 缓存 存储 器 可 以 加 快 计 算 机 对 存储 器 的 总 访问 时 间 。 

下 面 讨论 如 何 使 用 主 存储 器 地 址 的 各 个 地 址 域 。CPU 使 用 主 存储 器 地 址 的 其 中 一 个 地 址 域 ， 对 已 
驻 留 在 高 速 缓 存 中 的 请 求 数 据 ， 直 接 给 出 数据 在 高 速 缓存 中 的 位 置 ， 这 种 情况 称 为 高 速 缓存 命中 
(Cache hit); 而 CPU 对 没有 驻 留 在 高 速 缓存 中 的 请 求 数据 ， 会 指示 出 数据 将 要 存放 在 高 速 缓存 中 的 位 
置 ， 这 种 情况 称 为 高 速 绥 存 缺 失 (未 命中 ，cache miss) 。 对 于 关联 映射 模式 高 速 缓存 ， 这 一 点 略 有 不 
同 ， 后 面 会 简单 讨论 。 接 下 来 ，CPU 会 通过 检查 高 速 缓存 块 的 一 个 有 效 位 (valid bit) ， 来 验证 所 引用 
的 高 速 缓存 块 的 合法 性 。 如 果 所 检验 的 有 效 位 为 0， 即 表示 要 引用 的 高 速 缓存 块 不 正确 ,产生 了 一 次 
高 速 缓存 人 缺失， 所 以 CPU 必须 访问 主 存储 器 。 如 果 有 效 位 为 1， 表示 所 引用 的 高 速 缓存 数据 块 正 确 ， 
可 能 会 产生 一 次 高 速 缓 存 命中 。 但 是 ，CPU 还 需要 继续 完成 下 一 个 操作 步骤 后 ， 才 能 完全 确认 这 次 的 
高 速 缓存 命中 事件 。CPU 随后 要 将 属于 该 高 速 缓存 块 的 标记 与 主 存储 器 地 址 的 标记 域 (tag field) 进 
行 比较 。 标 记 是 主 存储 器 地 址 中 的 一 组 特殊 的 二 进 制 位 ， 用 来 标识 数据 块 的 身份 。 标 记 与 对 应 的 数据 
块 一 起 存放 到 高 速 缓存 中 。 如 果 标 记 匹配 ， 表 示 找 到 了 所 需 的 高 速 缓存 数 据 块 ， 即 产生 了 一 次 高 速 组 
存 命中 。 在 此 基础 上 ， 还 需要 在 高 速 缓存 块 中 定位 找 出 所 要 求 的 数据 字 的 存放 位 置 。 这 项 工作 可 以 通 
过 使 用 主 存储 器 地 址 中 一 个 称 为 字 域 (word field) 的 字 地 址 来 完成 。 字 域 代表 数 据 字 的 块 内 地 址 ， 所 
有 的 高 速 缓存 映射 模式 都 要 求 有 一 个 字 域 。 最 后 ， 地 址 中 剩余 的 字段 由 特定 的 映射 模式 来 决定 。 下 面 
的 部 分 将 讨论 三 种 主要 的 高 速 缓存 映射 模式 。 
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直接 映射 的 高 速 缓存 

直接 映射 的 高 速 缓存 采用 模块 方式 来 指定 高 速 缓存 和 主 存储 器 之 间 的 映射 关系 。 因 为 主 存储 器 块 
通常 比 高 速 缓 存 块 要 多 很 多 ， 所 以 很 明显 主 存储 器 中 的 块 要 通过 竞争 才能 获取 高 速 缓存 中 的 对 应 位 置 。 
直接 映射 方式 是 将 主 存储 器 中 的 块 X 映射 到 高 速 缓存 的 块 了， 对 应 的 模 量 为 N。 其 中 ，N 是 高 速 缓 存 
中 所 划分 的 存储 空间 块 的 总 数 。 例 如 ， 假 设 高 速 缓存 划分 为 10 个 块 。 那 么 直接 映射 方式 是 ， 主 存储 器 
中 的 第 0 块 映 射 到 高 速 缓存 中 的 第 0 块 ， 主 存储 器 中 的 第 1 块 映射 到 高 速 缓存 中 的 第 1 块 …… 主 存储 
器 中 的 第 9 块 映射 到 高 速 缓存 中 的 第 9 块 ; 而 主 存储 器 中 的 第 10 块 也 会 映射 到 高 速 缓存 中 的 第 0 块 。 
图 6-2 给 出 了 这 种 映射 关系 。 显 然 ， 主 存储 器 的 第 0 块 和 第 10 块 (以 及 第 20 块 , 第 30 块 等 等 ) 都 需 
要 竞争 映射 到 高 速 缓存 的 第 0 块 。 


高 速 缓存 


主 存储 器 
存储 器 





图 6-2” 主 存储 器 块 到 高 速 缓存 块 的 直接 映射 关系 


读者 也 许 会 奇怪 ， 如 果 主 存储 器 的 第 0 块 和 第 10 块 都 映射 到 高 速 缓存 的 第 0 块 ， 那 么 计算 机 又 如 
何 知道 在 某 个 特定 的 时 刻 ， 实 际 上 是 哪 一 个 数据 块 驻 留 在 高 速 缓存 的 第 0 块 存储 空间 ? 正确 的 回答 是 ， 
当 每 个 数据 块 被 复制 到 高 速 缓存 时 ， 它 们 的 身份 就 已 经 由 前 面 所 描述 的 标记 (tag〉 确定 了 。 仔 细 研 究 
可 以 发 现 ， 高 速 缓存 中 实际 存储 的 信息 内 容 要 比 从 主 存储 器 复制 的 数据 信息 多 ， 如 图 6-3 所 示 。 图 中 
有 两 个 合法 的 高 速 缓 存 数 据 块 。 第 0 块 包含 从 主 存储 器 复制 的 多 个 数据 字 ， 并 且 使 用 了 标记 
“00000000” 来 进行 身份 识别 。 第 1 块 也 同样 包含 多 个 数据 字 ， 但 却 使 用 了 标记 “11110101” 来 标识 。 
而 高 速 缓存 中 的 其 他 两 个 数据 块 是 非法 的 数据 块 。 

数据 块 标记 数据 合法 性 
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图 6-3 高 速 缓存 存储 空间 的 分 配 图 
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为 了 实现 直接 映射 功能 ， 二 进 制 的 主 存储 器 地 址 被 划分 为 如 图 6-4 所 示 的 几 个 域 。 





区 一 一 主 存 依 吕 地 福 的 三 进 侧 位 一 一 = 一 = 一 


图 6-4 采用 直接 映射 方式 的 主 存储 器 地 址 格式 

每 个 域 的 大 小 取决 于 主 存储 器 和 高 速 缓存 存储 器 的 物理 特性 。 字 〈word) 域 ， 有 时 又 称 为 偏 移 量 
(offset) 域 ， 用 来 唯一 地 识别 和 确定 来 自 某 个 指定 的 数据 块 中 的 一 个 数据 字 。 因 此 ， 字 域 必 须 具 有 合 
适 长 度 的 数据 位 。 同 样 ， 块 (block〉 域 也 是 如 此 ， 必 须 选择 一 个 唯一 的 高 速 缓存 块 。 地 址 中 剩余 的 一 
个 字段 是 标记 (tag) 域 。 在 复制 主 存储 器 中 的 数据 块 到 高 速 缓存 时 , 标记 会 随 着 数据 块 一 起 被 存储 在 
高 速 缓 存 中 ， 并 且 通 过 标记 可 以 唯一 识别 和 确定 该 数据 块 。 当 然 ， 这 三 个 字段 的 位 数 相 加 应 该 等 于 主 
存储 器 地 址 的 总 位 数 。 

考察 下 面 的 例子 : 假设 存储 器 由 2 个 字 组 成 ， 高 速 缓存 共有 16 个 存储 空间 块 ， 每 个 块 包含 8 个 


字 。 从 这 里 可 以 算出 ， 存 储 器 共 可 以 划分 为 55 一 20 块 。 显 然 ， 每 个 存储 器 的 地 址 需要 用 14 位 二 进 制 


数 来 表示 。 在 这 个 14 位 的 地 址 中 ， 最 右边 的 3 位 反映 的 是 字 域 ， 我 们 需要 使 用 3 位 二 进 制 数 才 能 唯一 
确定 一 个 数据 块 中 8 个 数据 字 的 一 个 字 。 这 里 ， 还 需要 使 用 4 位 才能 在 高 速 缓存 中 选 定 一 个 指定 的 数 
据 块 ， 高 速 缓存 中 共有 16 个 数据 块 。 因 此 ， 块 域 由 中 间 的 4 位 构成 ， 而 剩余 的 7 位 二 进 制 数 就 组 成 标 
识 域 。 不 同 字段 的 大 小 如 图 6-5 所 示 。 


7 位 4 位 3 位 





Sr 4 
图 6-5 例子 中 的 主 存储 器 的 地 址 格式 
如 前 所 述 ， 每 个 块 的 标记 应 该 随 着 该 块 一 起 存放 在 高 速 缓存 中 。 在 本 例 中 ， 主 存储 器 的 第 0 块 和 


第 16 块 都 要 映射 到 高 速 缓存 中 的 第 0 抉 存储 空间 ， 地 址 中 的 标记 将 允许 系统 能 够 识别 存放 在 高 速 缓存 
第 0 块 空间 的 是 主 存储 器 的 第 0 个 数据 块 还 是 


第 16 个 数据 块 。 可 以 着 到 泥 10 泌 地 址 各 第” ， 表 6-1 主 存储 器 有 映射 到 高 速 缓存 的 例子 
16 据闻 址 的 最 左边 7 位 是 不 同 的 》 也 就 是 它们 ”_ 主 存 储 器 。 ”映射 到 高 速 缓存 _ 
eo 块 0 (地 址 0，1) 一 一 一 一 一 一 一 ~ 块 0 
的 标记 是 不 同 的 ， 而 且 是 唯一 的 。 tn 0 

为 了 并 解 这 些 地 二 的 别 ,下 面 来 讨论 一 地址 15)” .类 ? 
个 规模 较 小 而 且 简单 的 例子 。 假 设 菜 个 计算 机 。” 块 3 (地 址 6,7) ” “、。 抉 3 
系统 使 用 的 是 直接 映射 高 速 缓存 ， 主 存储 器 由 ” 块 4 (地 址 8, 9) 一 一 一 一 一 > 块 0 
16 个 字 维 成 ,划分 为 8 块 ， 其 申 每 所 包含 2 个 ” 拓 5 (地 址 1 91D) 一 一 一 一 一 块 1 
字 。 再 假定 高 速 缓存 的 大 小 为 4 个 空间 块 ， 共 | re 
可 以 存放 8 个 字 。 表 6-1 给 出 了 这 种 主 存储 器 一 一 一 一 一 一 一 一 一 一 一 一 一 一 
到 高 速 缓存 的 映射 关系 。 

这 里 ; 


* 主 存储 器 地 址 为 4 位 ， 因 为 主 存储 器 中 共有 24 或 16 个 字 。 
。 这 个 4 位 的 主 存储 器 地 址 划分 成 3 个 域 : 字 域 占 1 位 (只 需要 1 位 就 可 以 区 分 一 个 块 中 的 两 个 
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字 )， 块 域 长 2 位 〈 高 速 缓存 中 有 4 块 ， 要 求 使 用 2 位 才能 唯一 确定 每 一 块 );; 标记 域 只 占 1 位 
(这 也 是 所 剩 下 的 位 )。 
这 样 ， 主 存储 器 地 址 可 划分 成 不 同 的 域 ， 如 图 6-6 所 示 。 


1 位 2 位 1 位 





和 4 人 > 
图 6-6 一 个 16 字 的 主 存储 器 的 地 址 格式 
假设 现在 生成 主 存储 器 地 址 9。 从 上 面 的 映射 列表 中 可 以 看 出 ， 地 址 9 代表 的 是 主 存储 器 中 的 第 4 
个 数据 块 。 而 主 存储 器 的 第 4 块 应 该 映射 到 高 速 缓存 的 第 0 块 。 也 就 是 说 ， 主 存储 器 中 第 4 块 的 内 容 


应 该 被 复制 到 高 速 缓存 的 第 0 块 。 然 而 ， 计 算 机 采用 实际 的 主 存储 器 地 址 来 决定 高 速 缓存 的 映射 模块 。 
这 里 使 用 二 进 制 数 来 表示 该 地 址 ， 如 图 6-7 所 示 。 


1 位 





位 一 
图 6-7 主 存储 器 地 址 9 二 1001, 的 域 的 划分 


当 CPU 生成 该 地 址 时 ， 首 先 取出 块 域 的 位 00， 并 利用 这 个 数值 引导 CPU 找到 正确 的 高 速 缓存 
块 。 数 值 00 表示 应 该 对 高 速 缓存 第 0 块 进行 校 验 。 如 果 高 速 缓存 块 检 验 正确 ， 随 后 将 标记 域 的 数值 1 
(存在 于 主 存储 器 地 址 中 ) 与 高 速 缓存 第 0 块 中 的 标记 进行 比较 。 如 果 高 速 缓存 的 标记 也 为 1， 说 明 主 
存储 器 的 第 4 个 数据 块 目前 正 驻 留 在 高 速 缓存 中 的 第 0 块 存储 空间 。 如 果 标 记 为 0， 说明 来 自主 存储 器 
的 第 0 个 数据 块 存放 在 第 0 从 高 速 缓存 块 的 位 置 。 为 了 明确 这 一 点 ， 比 较 下 面 两 个 主 存储 器 地 址 : 主 
存储 器 地 址 9 一 1001， 的 数据 位 于 高 速 缓存 的 第 4 块 中 ， 主 存储 器 地 址 1 二 00012 的 数据 位 于 高 速 缓存 
的 第 ,0 块 中 。 这 两 个 地 址 只 有 最 左边 的 位 不 同 ， 这 正 是 高 速 缓存 用 作 标 记 的 位 。 假 设 标记 也 相同 ， 就 
表示 来 自主 存储 器 的 第 汪 个 数据 块 〈 地 址 分 别 为 8 和 9) 正 驻 留 在 高 速 缓存 的 第 0 块 存储 空间 。 字 域 的 
数值 1 用 来 选择 该 数据 块 中 两 个 数据 字 的 其 中 一 个 字 。 因 为 该 位 的 数值 为 1， 我 们 就 选择 具有 偏 移 量 
为 1 的 字 (第 2 个 字 )， 进 而 找到 了 从 主 存储 器 地 址 9 的 存储 单元 复制 过 来 的 数据 。 

下 面 再 讨论 一 个 有 关 这 类 问题 的 例子 。 假 设 CPU 现在 生成 的 存储 器 地 址 为 4 一 0100* 。 中 间 的 两 位 
数值 (10) 指示 CPU 搜索 高 速 缓存 块 2。 如 果 数 据 块 正确 ， 会 将 最 左边 的 标记 位 〈0) 与 存放 在 该 高 
速 缓存 块 中 的 标记 进行 比较 。 如 果 标 记 正 确 ， 则 把 该 数据 块 的 第 一 个 字 〈 偏 移 量 为 0) 返回 CPU。 为 
了 进一步 理解 这 一 过 程 ， 读 者 可 以 以 主 存储 器 地 址 12 王 1100? 为 条 件 做 一 个 类 似 的 练习 。 

下 面 讨论 一 个 规模 较 大 的 例子 。 假 设 系统 采用 15 位 主 存储 器 地 址 和 64 个 高 速 缓存 块 。 如 果 每 个 
块 包含 8 个 字 ,， 那么 主 存储 器 的 15 位 地 址 将 会 被 划分 为 一 个 3 位 的 字 域 ， 一 个 6 位 的 块 域 ， 以 及 一 个 
6 位 的 标记 域 。 如 果 CPU 生成 一 个 如 下 的 主 存储 器 地 址 : 





标记 块 守 
GEU 将 访问 高 速 缓存 块 0。 如 果 找 到 一 个 000010 的 标记 ， 就 会 取出 该 数据 块 中 偏 移 量 为 4 的 数据 
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字 返 回 到 CPU。 





ee 原因 是 直接 映射 方式 并 不 需要 进行 
任何 的 搜索 操作 。 主 存储 器 中 的 每 个 数据 块 都 映射 到 高 速 缓存 中 指定 的 存储 单元 位 置 。 当 主 存储 器 地 
址 被 转换 成 某 个 高 速 缓存 地 址 时 ，CPU 只 需 简单 地 检查 地 址 的 块 域 位 ， 就 能 准确 地 知道 需要 到 高 速 组 
存 的 某 个 具体 位 置 去 查找 该 存储 器 块 。 这 种 工作 方式 与 读者 查找 电话 本 的 方式 非常 相似 : 电话 本 的 每 
一 页 通常 都 有 一 个 字母 索引 ， 如 果 要 查找 姓名 “Joe Smith”， 只 需 在 s 开头 的 列表 中 搜索 即 可 。 

下 面 讨论 一 个 相反 的 极端 情况 ， 即 我 们 并 不 为 主 存储 器 中 的 数据 块 唯一 指定 在 高 速 缓存 中 的 存放 
位 置 ， 而 是 允许 主 存储 器 中 的 数据 块 可 以 存放 到 高 速 缓存 的 任意 位 置 。 在 这 种 情况 下 ， 要 找到 从 主 存 
储 器 映射 的 数据 块 的 唯一 方法 是 搜索 全 部 高 速 缓存 。 这 一 点 类 似 于 要 在 本 书 作 者 的 办 公 桌 上 查找 所 有 
的 文件 的 情况 。 这 样 一 来 ， 整 个 高 速 缓存 需要 按照 关联 存储 器 (associative memory) 的 模式 构建 ， 以 
便 CPU 可 以 对 这 种 高 速 缓存 存储 器 执行 平行 搜索 。 也 就 是 说 ， 单 一 的 搜索 操作 必须 将 所 请 求 的 标记 与 
存放 在 高 速 缓 存 中 的 所 有 (all) 标记 进行 比 对 ， 以 确定 要 查找 的 数据 块 是 否 位 于 当前 的 高 速 缓存 存储 
器 中 。 关 联 存储 器 需要 特殊 的 硬件 来 支持 关联 搜索 ， 因 此 成 本 比较 高 。 

使 用 关联 映射 方式 时 ， 需 要 将 主 存储 器 的 地 址 划分 成 标记 域 和 字 域 两 部 分 。 例如， 对 上 面 所 述 的 
存储 器 配置 使 用 关联 映射 方式 : 主 存储 器 有 21 3 区 
字 ， 高 速 缓存 分 为 16 个 空间 块 且 每 个 高 速 缓存 
块 包含 8 个 字 。 从 图 6-8 可 以 看 出 ， 现 在 的 字 
域 仍然 是 3 位 ， 但 是 标记 域 变 成 了 11 位 。 该 标 
记 必 须 和 数据 块 一 起 存放 在 高 速 缓存 中 。 当 要 
在 高 速 缓存 中 搜索 某 个 特定 的 主 存储 器 数据 块 < (位 人 人， 
时 ，CPU 会 将 该 主 存储 器 地 址 的 标记 域 与 高 速 图 6-8 使 用 关联 映射 的 主 存储 器 的 地 址 格式 
缓存 中 存放 的 所 有 合法 的 标记 域 进行 比 对 。 如 
果 发 现 有 一 个 比 对 相同 ， 就 表示 找到 了 所 要 求 的 数据 块 。 记 住 ， 标 记 可 以 唯一 地 识别 和 确定 一 个 主 存 
储 器 中 的 数据 块 。 如 果 没 有 一 个 标记 匹配 ， 就 表示 产生 了 一 个 高 速 缓存 缺失 ， 而 且 数据 块 必须 从 主 存 
储 器 转移 到 高 速 缓存 。 

对 于 直接 映射 方式 ， 如 果 一 个 已 经 被 数据 块 占据 的 高 速 缓存 单元 需要 存放 新 的 数据 块 ， 那 么 就 必 
须 移 除 当前 在 高 速 缓存 中 的 数据 块 。 如 果 这 些 块 的 内 容 已 经 被 修改 过 ， 就 要 把 这 些 数据 块 重 写 到 主 存 
储 器 。 如 果 数 据 块 的 内 容 没 有 发 生变 化 ， 就 直接 使 用 新 的 数据 块 覆盖 原来 的 数据 块 。 然 而 ， 对 于 全 关 
联 映射 方式 ， 如 果 高 速 妥 存 已 经 装 满 ， 就 需要 一 种 置换 算法 来 决定 将 从 高 速 缓存 中 丢弃 哪个 数据 块 。 
被 丢弃 的 块 被 称 为 牺牲 志 (victim block)。 最 简单 的 置换 算法 是 先进 先 出 (first in，first out) 的 置换 
算法 ， 但 是 这 种 置换 算法 现在 已 经 较 少 使 用 。 置 换算 法 的 种 类 有 很 多 ， 将 在 后 面 的 章节 中 进行 讨论 。 








由 于 过 度 要 明和 和 结构 纪 末 的 乡 丰 。 关联 高 玉 组 存 非常 郧 货 。 虽然 直 搂 里 射 方 式 的 高 速 经 存 不 太 昌 
贵 ,但 是 使 用 功能 却 受到 了 很 大 的 限制 。 要 理解 直接 映射 方式 对 高 速 缓存 的 功能 限制 ， 可 以 设想 在 上 
面 介 绍 的 计算 机 结构 上 运行 一 个 程序 。 假 设 该 程序 在 执行 指令 时 ， 首 先 使 用 主 存储 器 的 数据 块 0， 再 
使 用 数据 块 16; 接着 又 使 用 数据 块 0; 继 而 再 使 用 数据 块 16， 如 此 重复 过 程 。 由 于 主 存储 器 中 的 数据 
块 0 和 数据 块 16 都 映射 到 高 速 缓 在 中 的 同一 个 存储 空间 块 ， 这 就 意味 着 程序 会 重复 不 断 地 将 数据 块 0 
移出 高 速 缓存 ， 将 数据 块 16 移 人 高 速 缓存 ;又 将 数据 块 16 移出 ;再 将 数据 块 0 移 人 的 这 类 操作 ， 而 
不 会 去 理会 高 速 缓存 空间 中 是 否 还 有 其 他 未 使 用 的 数据 块 。 如 果 使 用 全 关联 映射 高 速 缓存 ,就 可 以 纠 
正 这 一 问题 。 全 关联 高 速 缓存 允许 主 存储 器 中 的 数据 块 存放 到 高 速 缓存 存储 空间 的 任意 位 置 。 但 是 ， 
全 关联 映射 方法 却 要 求 一 个 较 大 的 标记 与 数据 块 一 起 存放 ， 也 就 说 需要 一 个 较 大 规模 的 高 速 缓存 存储 
器 。 同 时， 还 需要 有 专门 的 硬件 来 对 高 速 缓 存 中 的 数据 块 进行 搜索 ， 即 高 速 缓存 的 价格 会 更 加 昂贵 。 
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因此 ， 非 常 有 必要 发 展 一 种 介 于 这 两 者 之 间 的 解决 方案 。 

下 面 要 介绍 的 第 三 种 映射 方式 是 N 路 的 组 关联 高 速 缓存 映射 (N-way set associative Cache map- 
ping)， 它 是 上 面 两 种 方法 的 某 种 组 合 形式 。 首 先 ， 组 关联 映射 方法 类 似 于 直接 映射 高 速 缓存 ， 使 用 地 
址 将 主 存储 器 中 的 数据 块 映射 到 高 速 缓存 中 的 某 个 指定 的 存储 单元 。 但 是 ， 它 与 直接 映射 方法 的 重大 
区 别 在 于 : 这 种 方法 不 是 将 数据 块 映 射 到 高 速 缓 存 中 的 某 一 个 空间 块 ， 而 是 映射 到 由 儿 个 高 速 缓存 块 
组 成 的 某 个 块 组 中 。 同 一 个 高 速 缓存 中 的 所 有 组 的 大 小 必须 相同 。 当 然 ， 对 于 不 同 的 高 速 缓存 ， 组 的 
大 小 可 以 各 不 相同 。 例 如 ， 在 一 个 2 路 组 关联 高 速 缓存 中 ， 每 组 包含 两 个 高 速 缓存 块 ， 如 图 6-9 所 示 。 
从 图 中 可 见 ， 组 0 中 有 两 个 高 速 缓存 块 ， 其 中 一 个 数据 块 是 合法 的 ， 并 且 存 放 数 据 A、B、C…; 而 男 
外 一 个 数据 块 则 是 非法 的 。 组 1 的 情况 也 是 如 此 。 组 2 和 组 3 也 同样 保存 了 两 个 数据 块 ， 在 这 两 个 组 
中 只 有 第 二 个 数据 块 是 合法 的 。 一 个 8 路 的 组 关联 高 速 缓存 ， 每 个 组 中 包含 8 个 高 速 缓存 块 。 由 此 可 
见 ， 直 接 映 射 的 高 速 缓存 是 一 种 特殊 形式 的 N 路 的 组 关联 高 速 缓存 ， 直 接 映射 的 高 速 缓存 中 组 的 大 小 
只 有 1 个 高 速 缓存 块 。 


组 号 标记 组 中 的 第 0 块 合法 性 标记 组 中 的 第 1 块 合法 性 
这 A 二 
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6-9 一 个 2 路 的 组 关联 高 速 缓存 
在 组 关联 高 速 缓存 的 映射 方式 中 ， 主 存储 器 地 址 分 为 三 部 分 : 标记 域 、 组 域 和 字 域 。 标 记 域 和 字 
域 的 作用 与 前 面 介绍 的 直接 映射 方式 相同 ， 而 
组 域 ， 表 示 主 存储 器 中 的 数据 块 会 被 映射 到 高 
速 缓存 中 的 块 组 。 假 设 系统 有 一 个 24 字 的 主 存 
储 器 ， 使 用 2 路 的 组 关联 映射 高 速 缓存 。 其 中 ， 
高 速 缓存 由 16 个 块 组 成 ， 每 个 高 速 缓存 块 中 包 
含 8 个 字 。 如 果 将 高 速 缓存 的 16 个 块 分 成 8 个 “位 
组 ， 那 么 每 个 组 包含 2 个 高 速 缓存 块 。 因 此 ， 图 6-10 组 关联 映射 的 地 址 格式 
组 地 址 需要 由 3 位 二 进 制 数组 成 。 显 然 ， 字 域 也 是 3 位 ， 而 标记 域 为 8 位 ， 如 图 6-10 所 示 。 


6. 4.2 置换 策略 


在 直接 映射 方式 中 ， 如 果 多 个 主 存储 器 的 数据 块 争 用 某 个 高 速 缓存 块 ， 那 么 只 有 一 种 可 能 的 动作 : 
即将 现 有 的 数据 块 从 高 速 缓存 中 踢 出 ， 为 新 的 数据 块 留 出 存放 空间 。 这 一 过 程 称 为 置换 (replace- 
ment) 。 对 于 直接 映射 方式 ， 不 需要 使 用 置换 策略 ， 原 因 是 每 个 新 的 数据 块 所 对 应 的 映射 位 置 都 是 预定 
的 。 但是， 对 于 全 关联 高 速 缓存 和 组 关联 高 速 缓 存 ， 就 需要 用 某 种 置换 算法 来 确定 哪 一 个 块 是 要 从 高 
速 缓存 中 被 移 除 的 “牺牲 ” 块 。 当 采用 全 关联 高 速 缓存 时 ， 主 存储 器 块 的 映射 所 对 应 的 可 能 高 速 缓存 
块 的 位 置 有 K 个 ,其 中 K 表示 高 速 缓存 中 块 的 数目 。 当 采用 N 路 的 组 关联 映射 方式 时 ， 主 存储 器 中 
的 数据 志 可 以 映射 到 某 个 指定 的 高 速 缓 存 块 组 中 的 N 块 中 的 任意 一 块 。 现 在 的 问题 是 ， 如 何 确定 置换 
哪个 高 速 缓存 块 ? 决定 这 种 置换 的 算法 称 为 置换 策略 (replacement policy)。 

现在 介绍 几 种 常用 的 置换 策略 。 其 中 有 一 种 算法 并 不 是 实用 的 置换 算法 ， 但 却 可 以 用 来 作为 置换 
策略 的 基准 ， 用 于 测试 其 他 算法 是 否 是 最 佳 (optimal) 算法 。 事 实 上 ， 我 们 希望 保留 高 速 缓存 存储 器 
中 的 那些 在 不 久 将 要 使 用 的 数值 ;而 要 丢弃 以 后 不 再 需要 ， 或 在 某 段 时 间 内 不 需要 使 用 的 高 速 缓存 块 。 
最 佳 算法 需要 能 够 洞察 未 来 ， 并 且 可 以 根据 这 两 个 标准 准确 地 决定 要 保留 的 ， 或 者 是 被 排除 的 高 速 组 
存 块 。 这 也 正 是 最 佳 算法 要 完成 的 工作 。 最 佳 置换 算法 的 基本 思想 是 ， 蔡 换 掉 在 未 来 最 长 的 时 间 段 内 
不 再 使 用 的 高 速 缓存 块 。 例 如 ， 假 设 要 牺牲 高 速 缓存 块 必 须 在 块 0 和 块 工 之 间 做 出 选择 ， 如 果 块 0 在 5 
秒 后 会 再 次 被 使 用 ， 块 1 在 10 秒 后 会 再 次 被 使 用 ， 那 么 就 选择 丢弃 块 1。 从 实际 的 观点 出 发 ， 人 类 是 
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不 可 能 洞察 未 来 的 。 然 而 ， 可 以 运行 某 个 程序 ， 然 后 再 次 运行 这 个 程序 ， 这 样 就 可 以 有 效 地 知道 程序 
未 来 将 要 发 生 的 事情 。 在 第 二 次 运行 程序 时 ， 我 们 就 可 以 应 用 最 佳 算法 。 显 然 ， 使 用 最 佳 算法 可 以 保证 
最 低 的 高 速 缓存 缺失 率 。 由 于 我 们 无 法 从 每 个 程序 的 单 次 运行 过 程 中 看 到 未 来 将 要 发 生 的 事情 ， 因 此 最 
佳 算法 只 能 作为 决定 其 他 的 某 种 算法 优 劣 的 一 种 量度 方法 。 一 种 算法 越 接近 最 佳 算法 它 就 是 越 好 的 算法 。 

我 们 需要 的 是 最 接近 最 佳 算法 的 算法 。 这 里 有 几 种 不 同 的 选择 。 例 如 ， 可 以 考虑 时 间 局 部 性 。 推 
测 最 近 没 有 被 使 用 过 的 数值 ， 在 未 来 的 短 时 间 内 也 不 太 可 能 被 再 次 使 用 。 我 们 可 以 跟踪 记录 每 个 高 速 
缓存 块 上 次 被 访问 的 时 间 ， 为 每 个 高 速 缓存 块 分 配 一 个 时 间 标 签 ， 选 择 最 近 最 少 被 使 用 的 高 速 缓存 块 
作为 牺牲 块 。 这 种 算法 称 为 最 近 最 少 被 使 用 (〈least recently used，LRU) 算法 。 不 幸 的 是 ，LRU 算法 
要 求 系统 保留 每 个 高 速 缓存 块 的 历史 访问 记录 ， 这 就 要 求 高 速 缓存 必须 有 相当 大 的 存储 空间 ， 同 时 也 
会 减 慢 高 速 缓存 的 操作 速度 。 有 多 种 方法 近似 LRU 算法 ， 但 是 这 些 内 容 超出 了 本 书 的 范围 〈 读 者 参阅 
本 章 结尾 处 的 参考 文献 可 以 获取 更 多 的 信息 ) 。 

先进 先 出 《〈first in，first out，FIFPO) 是 另外 一 种 较为 流行 的 方法 。 利 用 这 种 方法 ， 存 放 在 高 速 缓存 
中 时 间 最 长 的 块 将 被 选择 作为 牺牲 块 从 高 速 缓存 存储 器 中 被 移 除 ， 而 不 管 这 个 块 在 最 近 何 时 被 使 用 过 。 

另外 一 种 选择 牺牲 块 的 方法 是 随机 〈random) 选择 。LRU 和 FIFO 遇 到 的 问题 是 存在 简 并 引用 
(degenerate reference) 的 情形 ， 这 时 会 产生 对 某 个 高 速 缓存 块 的 重复 操作 〈thrash) 。 即 不 停 地 重复 将 
一 个 数据 块 移出 高 速 缓存 ， 并 移 回 高 速 缓存 ;然后 又 移出 高 速 缓存 ， 再 移 回 高 速 缓存 ， 如 此 反复 。 对 
于 随机 选择 方法 ， 人 们 还 存在 一 些 争议 。 虽 然 它 不 会 出 现 对 某 个 块 的 重复 操作 ， 但 有 时 却 有 可 能 把 一 
些 在 即将 需要 的 数据 从 高 速 缓存 中 丢掉 。 遗 憾 的 是 ， 很 难 有 真正 意义 上 的 随机 置换 ， 并 且 随 机 置换 方 
法 会 降低 高 速 缓存 的 平均 性 能 。 

算法 的 选择 通常 要 取决 于 计算 机 系统 的 使 用 方式 。 对 于 所 有 情况 来 说 ， 不 存在 最 好 的 单一 的 、 实 
用 的 算法 。 基 于 这 种 理由 ， 设 计 人 员 使 用 适合 于 多 种 变化 环境 的 算法 。 


6. 4.3 ”有效 存 取 时 间 和 命中 几率 


分 层 存储 器 系统 的 性 能 可 以 采用 其 有 效 存 取 (访问 ) 时 间 (effective access time，EAT) ， 或 者 称 
为 每 次 访问 所 需要 的 平均 时 间 来 量度 。EAT 是 使 用 命中 率 与 相连 存储 器 层次 的 相对 访问 时 间 产 生 的 加 
权 平 均 。 例 如 ， 假 设 高 速 缓存 的 访问 时 间 是 10ns， 主 存储 器 的 访问 时 间 是 200ns， 高速 缓存 存储 器 的 
命中 率 是 99% 。 那 么 ， 对 于 这 样 一 个 两 级 的 存储 器 结构 ， 处 理 器 访问 一 个 数据 项 的 平均 时 间 为 : 


EAT=0.99(10ns) +0.01(200 ns}=9.9ns+2ns=11ns 
一 





高 速 缓存 命中 ”高速 缓存 缺失 

严格 说 来 ， 这 个 平均 时 间 的 真正 含义 是 什么 ?如 果 从 一 个 较 长 时 间 周 期 的 角度 来 看 访问 时 间 ， 这 
个 系统 的 行为 类 似 系统 具有 一 个 存 取 时 间 为 1lns 的 单一 的 大 的 存储 器 。 一 个 命中 率 为 99%% 的 高 速 缓存 
可 以 使 存储 器 系统 具有 很 好 的 工作 性 能 ， 虽 然 这 种 存储 器 的 大 部 分 都 是 采用 存 取 时 间 为 200ns 的 慢 速 
技术 构建 而 成 。 

计算 两 级 的 存储 器 有 效 存 取 时 间 的 公式 为 : 

EAT = HX Accessc + (1 — H) X Accesshmy 

其 中 ,五 为 高 速 缓存 命中 率 ，Accessr 是 高 速 缓存 的 访问 时 间 ， 并 且 Accessvw 是 主 存储 器 的 访问 时 间 。 

这 个 公式 可 以 推广 应 用 到 3 级 、 甚 至 4 级 的 存储 器 系统 ， 后 面 很 快 就 会 对 此 进行 讨论 。 


6.4.4 何 时 高 速 缓存 的 方法 会 失效 


当 程 序 具 有 局 部 性 时 ， 高 速 缓存 的 操作 方式 非常 有 效 。 但 是 ， 如 果 程 序 的 局 部 性 不 好 ， 高 速 缓存 
就 会 失效 ， 并 且 导 致 存储 器 的 层次 结构 的 性 能 很 差 。 特 别 是 面向 对 象 的 编程 可 能 会 导致 程序 的 局 部 性 
不 是 最 佳 。 另 外 一 个 局 部 性 较 差 的 例子 出 现在 对 二 维 数 组 的 访问 中 。 数 组 元 素 通 常 是 按照 行 优先 
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(row-major) 顺序 存储 的 。 为 举例 起 见 ， 假 设 数组 的 一 个 行 刚 好 可 以 存放 在 一 个 高 速 缓存 块 中 ， 并 且 
高 速 缓存 可 以 存放 数组 的 全 部 元 素 ， 而 不 只 是 数组 的 某 个 行 。 现 在 假设 有 一 个 程序 要 访问 该 数组 ， 每 
次 访问 数组 的 一 行 ， 对 数组 的 第 一 行 访 问 会 产生 一 次 高 速 缓存 缺失 。 但 是 ， 一 旦 数组 块 被 转移 到 高 速 
缓存 后 ， 那 么 接 下 来 对 该 行 的 所 有 访问 就 都 会 产生 命中 。 因 此 ， 在 对 一 个 5X4 数组 超过 20 次 的 访问 
中 (假设 程序 正在 访问 该 数组 的 每 个 元 素 )， 将 会 产生 5 次 缺失 和 15 次 命中 。 如 果 程 序 要 访问 的 是 一 
个 按照 列 优先 《column-major) 顺序 存储 数组 ， 那 么 对 该 数组 列 的 第 一 次 访问 会 产生 一 次 高 速 缓存 缺 
失 ， 处 理 器 随后 会 将 整 行 的 数组 元 素 转移 到 高 速 缓存 中 。 但 是 ， 对 该 列 的 第 二 次 访问 仍然 会 导致 另 一 
次 高 速 缓存 缺失 。 内 为 这 时 正在 对 数组 的 访问 是 按照 数组 的 列 进行 ， 所 以 已 经 移 人 高 速 缓存 的 数组 行 
的 数据 此 时 并 不 会 被 使 用 。 由 于 高 速 缓存 的 容量 并 不 够 大 ， 所 以 20 次 此 类 的 访问 就 会 产生 20 次 的 高 
速 缓存 缺失 。 要 介绍 的 第 三 个 例子 是 一 个 程序 对 一 个 线性 数组 进行 循环 操作 ， 而 该 数组 不 能 完全 存放 
到 高 速 缓存 中 。 如 果 按 照 这 种 方式 使 用 存储 器 ， 那 么 程序 的 局 部 性 就 会 大 大 降低 。 


6. 4.5 高 速 缓存 的 写 策略 


除了 要 选择 进行 置换 的 辆 牲 块 外 ,设计 人 员 还 必须 决定 对 高 速 缓 存 的 脏 块 (dirty block) 的 处 理 方 
案 。 高 速 缓存 中 的 脏 块 是 指 已 经 被 修改 过 的 数据 块 。 当 处 理 器 写 人 主 存储 器 时 ， 数 据 可 能 也 会 被 写 人 
”到 高 速 缓存 中 ， 原 因 是 假设 了 处 理 器 可 能 很 快 就 会 再 次 读 这 些 数据 。 如 果 修 改 了 某 个 高 速 缓存 块 的 数 

据 ， 高 速 缓存 的 写 策略 (write policy) 会 决定 何 时 更 新 对 应 的 主 存储 器 数据 块 来 保证 与 高 速 缓存 块 的 
数据 一 臻 性。 高 速 缓存 有 两 种 基本 的 写 策略 : 

“ 写 通 〈write-through) 一 一 写 通 策略 是 指 在 每 次 写 操作 时 ， 处 理 器 会 同时 更 新 高 速 缓存 和 主 存储 

器 中 对 应 的 数据 块 。 写 通 策略 的 速度 要 比 回 写 策略 的 速度 慢 ， 但 是 可 以 保证 高 速 缓存 中 的 内 容 

始终 与 主 系统 存储 器 相 一 致 。 写 通 策略 的 明显 缺点 是 ， 每 次 写 操作 都 要 访问 主 存储 器 。 使 用 写 通 

策略 意味 着 每 一 次 对 高 速 缓 存 的 写 操作 都 必需 伴随 一 次 对 主 存储 器 的 写 操作 ， 这 样 减 慢 了 系统 

的 速度 。 如 果 所 有 的 访问 都 是 写 操作 ， 那 么 存储 器 系统 的 速度 基本 上 会 减 慢 到 主 存储 器 的 访问 

速度 。 但 是 ， 在 实际 应 用 中 ， 大 多 数 存 储 器 的 访问 都 是 读 操作 。 央 此 ， 可 以 忽略 写 通 策略 所 带 来 

的 系统 速度 上 的 减 慢 。 

* 回 写 (write-back) 一 一 也 称 为 copyback， 是 指 当 只 有 某 个 高 速 缓存 块 被 选择 作为 牺牲 块 而 必须 

从 高 速 缓存 中 移 除 时 ， 处 理 器 才 更 新 主 存储 器 中 对 应 的 数据 块 。 通 常 ， 回 写 策 略 的 速度 会 比 写 

通 策略 的 速度 快 ， 原 因 是 处 理 器 不 会 因为 每 次 写 高 速 缓存 时 都 要 浪费 一 些 时间 写 信息 到 存储 器 。 

这 样 一 来 ， 存 储 器 访问 的 次 数 也 就 减少 了 。 回 写 策略 的 缺点 是 ， 主 存储 器 和 高 速 缓存 的 对 应 单 

元 在 某 些 时 刻 可 能 会 存放 着 不 同 的 数值 。 而 且 ， 如 果 某 个 进程 在 回 写 主 存储 器 完成 之 前 发 生 中 

断 〈 或 崩溃 )， 那 么 高 速 缓存 中 的 数据 可 能 会 入 失 。 

为 了 改进 高 速 缓存 的 性 能 ， 必 须 提高 高 速 缓存 的 命中 率 。 要 提高 高 速 缓存 的 命中 率 ， 可 以 使 用 更 
好 的 映射 算法 〈 粗 略 估计 ， 算 法 改进 可 以 增加 20 交 的 命中 率 )， 更 好 的 写 操作 技巧 (具有 增加 15% 命 
中 率 的 潜在 能 力 )， 更 好 的 置换 算法 (最 多 可 有 10% 的 命中 率 增加 ) 和 更 好 的 程序 编码 方案 。 正 如 前 
面 介绍 的 有 关 数 组 的 例子 ， 按 行 访问 的 编码 方案 要 比 按 列 访问 的 编码 方案 最 多 增加 30% 的 命中 率 。 另 
外 ， 简 单 地 增加 高 速 缓存 的 容量 大 小 可 以 改善 大 约 1~4% 的 命中 率 , 但 是 并 不 能 保证 总 是 如 此 。 


6.5 虚拟 存储 器 . 


高 速 缓存 允许 计算 机 从 一 个 较 小 规模 但 速度 较 快 的 高 速 缓存 存储 器 中 ， 频 繁 地 访问 使 用 过 的 数 
据 。 高 速 缓存 位 于 靠近 存储 器 层次 结构 的 顶部 。 这 种 分 层 组 织 结构 所 固有 的 另外 一 个 重要 概念 是 虚 
拟 存 储 器 (virtual memory) 。 虚 拟 存储 器 使 用 硬盘 作为 RAM 存储 器 的 扩充 ,增加 了 进程 可 以 使 用 的 
有 效 地 址 空间 。 大 多 数 个 人 计算 机 的 主 存储 器 的 容量 相对 较 小 ， 通 常 小 于 512MB。 它 通常 没有 足够 
的 存储 空间 来 并 发 地 保持 多 种 应 用 程序 。 比 如 同时 运行 一 个 字 处 理应 用 程序 ， 一 个 电子 邮件 (e-mail) 
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程序 和 一 个 绘图 程序 ， 另 外 还 要 运行 自身 的 操作 系统 。 使 用 虚拟 存储 器 ， 计 算 机 可 以 寻 址 比 实际 主 
存储 器 更 多 的 主 存储 器 空间 。 计 算 机 使 用 硬盘 驱动 器 保持 额外 的 主 存储 器 空间 。 硬 盘 上 的 这 部 分 区 
域 被 称 为 页 文件 (page file) ， 因 为 这 些 页 文件 在 硬盘 上 保持 主 存储 器 的 信息 块 。 理 解 虚拟 存储 器 最 
简单 的 方法 是 将 虚拟 存储 器 想像 为 一 个 从 概念 上 虚构 的 大 存储 器 单元 ， 其 中 所 有 的 寻 址 问题 都 由 操 
作 系 统 来 处 理 。 

实现 虚拟 存储 器 最 常用 的 方法 是 使 用 主 存储 器 的 分 页 机 制 (paging)， 这 种 方法 是 将 主 存储 器 划分 
成 固定 大 小 的 块 ， 并 且 程序 也 被 划分 成 相同 大 小 的 块 。 通 常 ， 程 序 块 会 根据 需要 被 存放 到 存储 器 中 。 
没有 必要 将 程序 的 连续 块 也 存储 到 主 存储 器 的 连续 块 中 。 因 为 程序 的 各 个 片段 可 以 无 序 存 储 ， 所 以 程 
序 的 地 址 一 旦 由 CPU 生成 ， 就 必须 转换 成 主 存储 器 的 地 址 。 如 前 所 述 ， 在 高 速 缓存 方式 ， 主 存储 器 的 
地 址 应 该 转换 为 高 速 缓存 的 位 置 。 在 使 用 虚拟 存储 器 时 ， 这 点 是 相同 的 ;每 个 虚拟 地 址 都 必须 转换 为 
物理 地 址 。 但 是 ， 怎 样 才能 做 到 这 一 点 呢 ? 在 对 虚拟 存储 器 进行 深入 讨论 之 前 ， 我 们 先 定义 一 些 经 常 
使 用 的 通过 分 页 实现 虚拟 存储 器 的 术语 : 

。 庶 拟 地 址 《virtual address) 一 一 进程 所 使 用 的 逻辑 地 址 或 程序 地 址 。 只 要 CPU 生成 一 个 地 址 ， 

就 总 对 应 指 虚 拟 地 址 空间 。 

。 物理 地 址 (physical address) 物理 存储 器 的 实际 地 址 。 

* 映射 (mapping) 一 一 一 种 地 址 变换 机 制 ， 通 过 映射 可 以 将 虚拟 地 址 转换 成 物理 地 址 。 这 类 似 于 

高 速 缓存 映射 。 

。 页 帧 (page frame) 由 主 存储 器 〈 物 理 存储 器 ) 分 成 的 相等 大 小 的 信息 块 或 数据 块 。 

。 页 (pages) 由 虚拟 存储 器 ( 届 辑 地 址 空间 〉 划 分 成 的 信息 块 或 数据 块 。 每 页 的 大 小 与 一 个 

页 帧 相同 。 在 硬盘 上 存储 虚拟 页 及 以 供 进程 使 用 。 

"分 页 (paging) 一 一 将 一 个 虚拟 页 从 硬盘 复制 到 主 存储 器 的 某 个 页 帧 的 过 程 。 

。 存 储 碎 片 (fragmentation) 变 得 不 能 用 的 存储 器 单元 。 

* 缺 页 〈page fault) 一 一 当 一 个 请 求 页 在 主 存储 器 中 没有 找到 时 所 发 生 的 事件 ， 必 须 将 请 求 页 从 

硬盘 复制 到 存储 器 。 

因为 主 存储 器 和 虚拟 存储 器 都 被 划分 成 相同 大 小 的 页 ， 所 以 我 们 可 以 把 程序 进程 的 地 址 空间 的 一 
些 片 段 移动 到 主 存储 器 中 ， 但 并 不 需要 将 这 些 片 断 的 内 容 按 照 连 续 的 模式 存储 。 如 前 所 述 ， 我 们 不 必 
立即 将 所 有 进程 全 部 装 人 主 存储 器 中 ;虚拟 存储 器 允许 存储 器 中 只 需 存在 特定 片断 即 可 运行 程序 。 暂 
时 不 用 的 程序 部 分 会 存储 在 硬盘 上 的 页 文件 中 。 

可 以 使 用 不 同 的 技术 来 实现 虚拟 存储 器 ， 包 括 分 页 、 分 段 或 分 页 与 分 段 的 组 合 方式 。 分 页 是 最 常 
用 的 技术 。 在 学 习 操 作 系统 时 ， 将 详细 讨论 这 一 主题 。 分 页 技术 的 成 功 与 否 ， 就 如 同 高 速 缓存 技术 一 - 
样 ， 在 很 大 程度 上 依赖 于 局 部 性 原理 。 如 果 在 主 存储 器 中 没有 所 需要 的 数据 ， 则 会 将 该 数据 所 在 的 整 
个 块 都 从 硬盘 拷贝 到 主 存储 器 ， 并 且 期 望 同一 页 的 其 他 数据 将 在 程序 的 继续 执行 过 程 中 有 用 。 


6.5.1 分 页 


分 页 的 基本 思想 非常 简单 :按照 固定 大 小 的 信息 块 (页 帧 ) 为 各 个 进程 分 配 物理 存储 空间 . 并且 
通过 将 信息 写 人 页 表 (page table) 的 方式 跟踪 记录 过 程 的 不 同 页 的 存放 位 置 。 每 个 进程 都 有 自己 的 页 
表 ， 页 表 通 常 驻 留 在 主 存储 器 中 ， 页 表 存 储 该 进程 的 每 个 虚拟 页 的 物理 位 置 。 页 表 一 般 有 N 行 ，N 代 
表 该 进程 的 虚拟 页 的 页 码 数 。 如 果 当 前 进程 的 某 些 页 不 在 主 存储 器 中 ， 则 页 表 会 通过 设置 一 个 有 效 位 
《valid bit) 为 0 来 指示 如果 进 程 的 某 一 页 当前 已 经 在 主 存储 器 中 ， 则 表示 该 页 的 有 效 位 设置 为 1。 内 
此 ， 每 个 页 表 的 人 口 目录 都 由 下 面 的 两 部 分 内 容 组 成 : 有 效 位 和 帧 数 。 

通常 页 表 中 还 会 附加 一 些 其 他 内 容 ， 以 便 传 递 更 多 的 信息 。 例 如 ， 增 加 一 个 修正 位 〈dirty bit， 或 
称 modify bit) 来 指示 页 中 的 内 容 是 否 已 经 发 生 了 改变 。 这 样 做 可 以 使 处 理 器 在 进行 返回 页 内 容 到 硬盘 
的 操作 时 会 更 有 效率 。 如 果 页 没有 被 修改 ， 则 不 需要 在 磁盘 上 重 写 该 页 。 还 可 以 增加 另外 一 个 使 用 位 
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Cusage bit) 来 指示 页 的 使 用 情况 。 只 要 处 理 器 访问 过 菜 一 页 ， 设 置 该 位 为 1。-- 定 时 间 周 期 后 ， 又 会 
设置 该 使 用 位 为 0。 如 果 该 页 被 再 次 引用 ， 则 使 用 位 又 被 设置 为 1。 但是， 如果 该 使 用 位 保持 为 0， 说 
明 在 某 段 时 间 间 隔 内 未 使 用 过 该 页 。 因 此 ， 系 统 就 可 能 把 该 页 从 主 存储 器 移出 ， 放 到 磁盘 上 。 这 种 做 
法 当然 可 以 使 系统 受益 ， 因 为 系统 释放 了 该 页 所 占用 的 存储 空间 给 进程 最 终 需要 使 用 的 另外 一 页 (在 
介绍 置换 算法 时 再 做 详细 讨论 这 一 内 容 ) 。 

虚拟 存储 器 中 页 的 大 小 与 物理 存储 器 的 页 帧 相同 。 程 序 进程 的 存储 空间 分 为 固定 大 小 的 页 ， 当 把 
程序 的 最 后 一 页 复制 到 存储 器 时 ， 可 能 会 产生 潜在 的 内 部 碎片 (internal fragmentation) 现象 。 进 程 实 
际 上 可 能 并 不 需要 占用 整个 页 帧 ， 但 是 又 没有 其 他 的 进程 使 用 该 页 帧 的 剩余 部 分 。 所 以 ， 程 序 进程 所 
占用 的 这 个 最 后 页 幢 中 使 用 的 存储 空间 显然 被 浪费 掉 了 。 如 果 进程 本 身 的 全 部 内 容 需 要 占用 的 空间 小 
于 一 个 整 责 ， 而 在 复制 到 存储 器 时 就 必须 占用 一 个 完整 的 页 帧 ， 这 时 存储 碎片 的 情况 就 可 能 会 发 生 。 
对 于 某 个 特定 的 存储 器 分 区 〈 这 里 指 分 页 ) ， 内 部 碎片 会 导致 一些 未 使 用 的 存储 空间 。 

学 习 了 分 页 的 基本 概念 ， 下 面 讨论 分 页 的 工作 原理 。 当 某 个 进程 生成 一 个 虚拟 地 址 时 ， 操 作 系统 
必须 动态 地 将 虚拟 地 址 转换 成 数据 实际 驻 留 的 存储 器 的 物理 地 址 。 为 了 简化 问题 起 见 ， 这 里 假设 没有 
高 速 缓存 存储 器 。 例 如 ， 从 程序 的 观点 来 说 ， 可 以 看 到 一 个 10 字 节 程序 的 最 后 -一 个 字 节 将 会 存放 在 地 
址 9。 假定 程序 是 由 1 字 节 指令 和 1 字 节 地 址 组 成 ， 存 储 器 从 地 址 0 开始 。 但 是 ， 当 将 程序 实际 装 入 到 
存储 器 时 ， 你 辑 地 址 9 在 汇编 语言 程序 中 可 能 是 对 标号 X 的 引用 ) 可 能 实际 驻 留 在 物理 存储 器 的 位 
置 是 1239， 这 也 就 意味 着 程序 是 从 物理 地 址 1230 处 开始 装 入 。 所 以 ,需要 有 种 简单 的 方法 将 这 个 多 
辑 ， 或 称 为 虚拟 地 址 0 转换 成 物理 地 址 1230。 

为 了 实现 这 种 地 址 之 间 的 转换 ， 可 以 把 虚拟 地 址 分 成 两 个 部 分 : 页 域 page field) 和 偏 移 量 城 
(offset field) 。 偏 移 量 表示 要 使 用 的 数据 在 页 内 的 位 置 。 这 种 地 址 转换 的 过 程 类 似 于 高 速 缓 存 映射 算法 
中 将 主 存储 器 地 址 划分 成 不 同 域 的 过 程 。 与 高 速 缓存 块 的 划分 相似 ， 页 面 的 大 小 总 是 满足 2 的 乘 方 关 
系 。 这 种 做 法 显然 可 以 简化 从 虚拟 地 址 中 提取 页 码 和 偏 移 量 的 操作 ，。 

要 访问 给 定 虚拟 地 址 的 数据 ， 系 统 需要 执行 以 下 的 步 又 ， 

1. 从 虚拟 地 址 中 提取 页 码 。 

2. 从 虚拟 地 址 中 提取 偏 移 量 。 

3. 通过 访问 页 表 将 页 码 转换 为 对 应 的 物理 页 帧 数 。 

A. 在 页 表 中 查找 页 码 〈 使 用 虚拟 地 址 的 页 码 作为 索引 )。 

B. 检验 页 的 有 效 位 。 

1) 如 果 有 效 位 二 0， 则 表示 系统 产生 了 一 个 缺 页 事件 。 这 时 ， 操 作 系统 必须 介入 完成 以 下 任务 : 

a. 在 磁盘 上 查找 到 所 使 用 的 页 。 

b. 寻找 一 个 空 的 页 帧 如 果 存 储 器 满 的 话 ， 则 必须 从 主 存储 器 中 移 除 一 个 “牺牲 ”页 ， 并 且 将 其 
内 容 复制 到 硬盘 ) 。 

c. 把 要 使 用 的 页 复制 到 主 存储 器 的 空 页 帧 。 

d. 更 新 页 表 (新 装 和 的 虚拟 页 在 已 经 修改 过 的 页 表 中 必须 有 自己 的 页 帧 数 和 有 效 位 。 如 果 有 某 个 
“牺牲 ”页 ， 则 必须 将 有 效 位 设置 为 0) 。 

.重新 执行 引起 缺 页 的 程序 进程 ， 继 续 到 步骤 B2。 

2) 如 果 有 效 位 二 1， 则 表示 查找 的 页 已 经 在 主 存储 器 中 、 

a. 使 用 实际 帧 数 普 代 虚拟 页 码 ，。 

b. 对 于 给 定 的 虚拟 页 访问 对 应 的 物理 页 帧 中 的 位 于 给 定 偏 移 量 位 置 的 数据 。 具 体 物理 地 址 是 ， 
页 帧 加 上 偏 移 量 。 

值得 注意 的 是 ， 如 果 发 生 缺 页 ， 进 程 在 主 存储 器 中 有 空 的 页 帧 ， 那 么 新 近 取 回 的 页 可 以 放置 在 空 
页 帧 的 任意 页 帧 内 。 但 是 ， 如 果 分 配给 进程 的 主 存 储 器 已 经 满 ， 则 必须 选择 一 个 钙 牲 页。 选择 牺牲 页 
的 工作 需要 使 用 量 换 算法 ， 这 种 置换 算法 与 高 速 组 存 中 使 用 的 置换 算法 非常 类 似 。FIFO、 随 机 选择 和 
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LRU 都 是 挑选 辆 牲 页 的 各 种 可 能 的 置换 算法 。 要 了 解 有 关 置 换算 法 的 更 多 信息 ， 可 以 参阅 本 章 结 尾 处 


的 参考 文献 。 


下 面 举 例 说 明 分 页 的 工作 过 程 。 假 设 对 于 某 个 特定 的 进程 ， 有 一 个 2 字 的 虚拟 地 址 空间 和 包含 4 
个 页 帧 的 物理 存储 器 ， 但 是 没有 高 速 缓 在。 这 意味 着 程序 生成 的 地 址 空间 范围 是 0 到 2551o， 即 00 到 
FF16 。 再 假定 物理 页 帧 的 长 度 为 32 个 字 。 虚 拟 地 址 需要 有 8 位 ， 而 物理 地 址 为 7 位 。 即 4 帧 各 32 个 
字 ， 总 共 是 128 个 字 ， 或 27 个 字 。 另 外 ， 还 假设 进程 中 某 些 页 已 经 被 装 和 人 主 存储 器 中 。 图 6-11 为 系统 


当前 状态 的 示意 图 。 
虚拟 存储 器 物理 存储 器 





洁 





~ 了 了 wwbb 一 呈 


图 6-11 使 用 分 页 机 制 的 当前 状态 和 关联 页 表 
每 个 虚拟 地 址 具有 8 位 ， 并 且 分 为 两 个 区 域 : 页 域 为 3 位 ， 表 示 总 共有 23 个 虚拟 存储 器 页 


( 苇 )=2。 每 一 页 的 长 度 为 2 二 32 个 字 ， 所 以 页 偏 


移 量 需要 5 位。 因此 ，8 位 虚拟 地 址 格式 如 图 6-12 所 
示 。 

假设 系统 现在 生成 了 一 个 虚拟 地 址 1310 三 0Di6 三 
00001101? 。 首 先 将 这 个 二 进 制 地址 划分 为 页 域 和 偏 移 
量 域 (参见 图 6-13) 。 页 域 P= 二 0002， 而 偏 移 量 域 等 于 
011012。 为 了 继续 代码 转换 过 程 ， 使 用 该 页 域 的 数值 
000 作为 一 个 索引 进入 页 表 查 询 。 找 到 页 表 的 第 0 个 
目录 , 发现 虚拟 页 的 第 0 页 映射 到 物理 页 帧 的 第 
2 二 102 帧 。 这 样 ， 被 转换 的 物理 地 址 就 变 成 了 页 帧 2， 
加 上 偏 移 量 13。 注 意 ， 物 理 地 址 只 有 .7 位 。 其 中 ,页 
帧 占 2 位 ， 共 4 帧 ， 偏 移 量 占 5 位 。 若 采用 二 进 制 数 ， 
物理 地 址 就 是 1001101> ， 或 写成 地 址 4D16 二 771o， 如 
图 6-14 所 示 。 同 样 ， 也 可 以 采用 其 他 方式 查找 到 该 地 
址 。 每 页 有 32 个 字 ， 而 要 找 的 虚拟 地 址 在 虚拟 页 的 第 
0 页 ， 被 映射 到 物理 页 帧 的 第 2 帧 。 因 为 页 帧 2 是 从 地 
址 64 开始 的 ， 而 偏 移 量 为 13， 所 以 最 后 的 物理 地 址 就 
是 77。 

下 面 , 我 们 研究 一 个 真实 的 小 系统 的 完整 例子 
(同样 ， 不 涉及 高 速 缓 存 )。 假 设 ， 长 度 为 16 字 节 的 程 
序 ， 需要 访问 一 个 按 字 节 方式 编 址 的 8 字 节 的 存储 器 。 


< 8 人 人 > 





3 位 5 位 


图 6-12 一 个 8 位 虚拟 地 址 的 格式 ， 页 的 
大 小 为 2 二 32 个 字 


一 8 位 一 一 一 > 





3 位 5 位 
图 6-13 虚拟 地 址 00001101; = 二 13w 的 格式 


< 位 > 





2 位 5 位 
图 6-14 物理 地 址 1001101; = 二 771 的 格式 


176 第 6 音 





这 就 是 说 ， 存 储 器 的 每 个 字 节 或 字 ， 都 有 自己 的 地 址 。 每 一 页 的 长 度 是 2 个 字 ( 字 节 )。 程 序 执行 时 ， 
生成 如 下 的 地 址 引用 的 字符 串 ( 按 十 进 制 数值 给 出 ): 0，1，2，3，6，7，10，11。 这 个 地 址 引用 的 字 
符 串 表 示 : 程序 进程 将 首先 引用 地 址 0， 然 后 引用 地 址 1， 接 下 来 是 地 址 2， 等 等 。 最 初 ， 存 储 器 中 并 
没有 保存 该 程序 的 页 。 当 请 求 使 用 地 址 0 时 ， 地 址 0 和 地 址 1 (它们 都 位 于 第 0 页 中 ) 的 内 容 都 被 复制 
到 主 存储 器 页 帧 的 第 2 帧 内 。 这 里 假设 ， 另 一 个 进程 正在 占用 存储 器 的 第 0 帧 和 第 1 帧 ， 因 此 这 两 个 
帧 不 可 用 。 这 是 一 个 有 关 缺 页 的 例子 ， 因 为 要 查找 的 程序 页 不 在 主 存储 器 ， 需 要 从 磁盘 中 提取 。 然 而 ， 
当 引 用 地 址 1 时 ， 数 据 已 经 存在 于 主 存储 器 中 ， 所 以 产生 了 一 次 页 命中 。 接 着 ， 在 引用 地 址 2 时 ， 又 
会 产生 另 一 次 缺 页 事件 。 该 程序 的 第 1 页 会 被 复制 到 存储 器 的 第 0 帧 。 程 序 进程 如 此 继续 进行 。 当 上 
面 的 这 些 地 址 都 被 引用 ， 并 且 所 有 相关 的 程序 页 也 都 已 经 从 磁盘 复制 到 主 存储 器 后 ， 该 系统 的 状态 就 
变 成 了 如 图 6-15a 所 示 的 状态 。 从 图 中 可 见 ， 地 址 0 包含 了 数据 值 A 的 程序 页 ， 目 前 正 驻 留 在 地 址 为 
4 一 100? 的 存储 器 单元 中 。 因 此 ，CPU 必须 将 虚拟 地 址 0 转换 为 物理 地 址 4， 并 且 使 用 前 面 介绍 的 转换 
方法 来 完成 这 种 地 址 转换 任务 。 注 意 ， 因 为 主 存储 器 地 址 只 有 3 位 ， 对 应 于 存储 器 只 有 8 个 字 节 。 而 
虚拟 地 址 必须 有 4 位 (对 应 于 程序 进程 的 长 度 在 虚拟 地 址 中 包含 16 个 字 节 )。 因 此 ， 这 种 地 址 的 转换 
也 必须 是 从 4 位 地 址 转换 成 3 位 地 址 。 
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页 3  ” 偏 移 量 0 
日 页 表 9 虚拟 地 址 10,.=1010，, 中 物理 地 址 


图 6-15 一 个 小 规模 存储 器 的 例子 


图 6-15b 描述 的 是 在 程序 访问 了 请 求 的 虚拟 页 后 的 进程 页 表 。 不 难看 出 ,页 0、 页 1、 页 3 和 页 5 
进程 都 是 合法 的 ， 并 且 都 驻 留 在 存储 器 中 。 但 是 ， 页 2、 页 6 和 页 7 却 是 非法 的 ， 引 用 它们 将 会 产生 缺 
页 的 错误 。 

下 面 ， 我 们 来 仔细 分 析 一 下 这 种 地 址 的 转换 过 程 。 假 设 CPU 现在 第 二 次 生成 程序 地 址 ， 或 者 说 是 
虚拟 地 址 10 王 1010* 。 从 图 6-15a 中 可 见 ， 存 放 数据 “K” 的 程序 地 址 单元 驻 留 在 主 存储 器 地 址 为 
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6 二 0110z 的 存储 单元 中 。 我 们 知道 ， 计 算 机 必须 执行 某 个 特定 的 转换 过 程 来 寻找 数据 。 因 此 ， 可 将 虚 
拟 地 址 1010* 划分 为 页 域 和 偏 移 量 域 。 因 为 程序 的 长 度 有 8 页 ， 所 以 页 域 需要 占用 3 位 ， 余 下 1 位 地 
址 就 留 给 了 偏 移 量 。 因 为 每 页 只 有 2 个 字 ， 所 以 这 种 划分 是 正确 的 。 这 种 域 的 划分 如 图 6-15c 所 示 。 

一 旦 计算 机 知道 了 这 些 地 址 域 的 内 容 ， 将 虚拟 地 址 转化 成 物理 地 址 的 工作 实际 上 是 一 件 非常 容易 
的 事情 。 现 在 ,我 们 使 用 页 域 中 的 数值 1012 作为 一 个 索引 进入 页 表 。 因 为 1012 三 5， 所 以 就 用 5 作为 
偏 移 量 查找 页 表 。 从 对 应 的 页 表 可 以 发 现 ， 虚 拟 页 5 映射 到 物理 页 的 第 3 帧 ， 参 见 图 6-15b。 现 在 ， 采 
用 物理 页 的 帧 数 3 二 112 来 取代 虚拟 页 的 页 码 5 二 101，。， 但 需要 保持 相同 的 偏 移 量 。 新 的 物理 地 址 为 
1102， 如 图 6-15d 所 示 。 很 显然 ， 这 一 程序 进程 已 经 成 功 地 实现 了 从 虚拟 地 址 到 物理 地 址 的 转换 ， 并 
且 正 如 所 要 求 的 那样 ， 地 址 的 位 数 也 从 4 位 减少 到 3 位 。 

上 面 介 绍 的 是 一 个 规模 较 小 的 存储 器 系统 ， 下 面 将 讨论 一 个 更 大 规模 ， 更 接近 实际 的 存储 器 系统 
的 例子 。 假 设 虚拟 地 址 空间 的 长 度 为 8KB 字 ， 物 理 存储 器 的 大 小 为 4KB 字 。 它 是 按 字 节 方式 进行 寻 
址 。 物 理 存储 器 页 的 大 小 为 1KB 字 。 这 里 的 系统 也 没有 涉及 高 速 缓存 存储 器 ， 但 是 对 本 例 的 讨论 会 有 
助 于 更 好 地 理解 虚拟 存储 器 的 工作 原理 。 最 后 ， 我 们 将 会 举例 讨论 一 个 既 使 用 分 页 ， 又 具有 高 速 缓存 
功能 的 存储 器 。 因 为 虚拟 存储 器 的 大 小 为 8SKB 王 213 ， 所 以 虚拟 地 址 的 位 数 有 13 位 。 其 中 ，3 位 地 址 用 


作 页 域 ， 对 应 于 虚拟 页 的 总 页 码 215 一 23 页 ; 并且 一 个 10 位 的 偏 移 量 ， 对 应 于 每 页 有 1KB= 二 210 字 节 。 


显然 ， 物 理 存储 器 地 址 只 有 12 位 ， 即 4KB=2? 字 。 其 中 ，2 位 地 址 用 作为 页 域 ， 主 存储 器 仅 有 22 个 
页 帧 ; 余下 的 10 位 地 址 就 是 页 内 偏 移 量 。 虚 拟 地 址 和 物理 地 址 的 格式 如 图 6-16a 所 示 。 

作为 举例 ， 假 定 页 表 内 容 如 图 6-16b 所 示 。 图 6-16c 为 表示 不 同 存储 器 地 址 (以 10 为 基 ) 的 列表 ， 
该 表 对 于 说 明 存储 器 地 址 转换 时 非常 有 用 。 

假设 CPU 生成 了 一 个 虚拟 地 址 545910 二 10101010100112。 图 6-16d 说 明了 如 何 将 这 个 虚拟 地 址 划 
分 成 页 域 和 偏 移 量 域 ， 以 及 如 何 将 这 个 虚拟 地 址 转换 为 物理 地 址 13631o 一 010101010011。。 从 本 质 上 来 
说 ,物理 地 址 的 帧 页 码 01 将 代替 虚拟 地 址 中 页 域 的 数值 101， 这 反映 了 虚拟 地 址 的 页 5 将 映射 到 物理 
地 址 的 第 1 帧 ， 参 见 图 6-16b 的 页 表 。 图 6-16e 说 明了 如 何 将 虚拟 地 址 205010 转 换 为 物理 地 址 2。 图 
6-16f 表示 的 是 虚拟 地 址 41001o 产 生 了 一 个 缺 页 的 错误 ， 页 4 二 10010 在 页 表 中 属于 非法 页 。 

需要 指出 的 是 ， 要 选择 一 个 合适 的 页 面 大 小 是 十 分 困难 的 。 页 的 长 度 越 大 ， 所 需要 的 页 表 就 会 越 
小 ， 这 样 可 以 节省 主 存储 器 的 存储 空间 。 但 是 ， 如 果 每 页 的 容量 太 大 ， 可 能 造成 页 内 部 的 碎片 现象 就 
会 变 得 更 加 严重 。 较 大 的 页 容量 同样 也 意味 着 从 磁盘 到 主 存储 器 的 实际 转移 操作 的 次 数 会 比较 少 ， 内 
为 每 次 转移 的 信息 块 变 大 。 但 是 ， 如 果 转 移 的 信息 块 太 大 ， 程 序 的 局 部 性 法 则 会 开始 遭 到 破坏 。 而 且 ， 
由 于 大 信息 块 可 能 转移 太 多 不 需要 的 数据 ， 而 导致 资源 的 浪费 。 


6. 5.2 使 用 分 页 的 有 效 存 取 时 间 


在 分 析 高 速 缓存 时 ， 我 们 引入 了 有 效 存 取 时 间 的 表示 方法 。 在 使 用 虚拟 存储 器 时 ， 我 们 同样 也 需要 
介绍 地 址 有 效 存 取 时 间 〈EAT) 的 概念 。 这 里 也 存在 着 一 个 与 虚拟 存储 器 相关 的 时 间 损 失 (开销 ): 处 理 
器 每 次 访问 存储 器 ， 都 必须 执行 两 次 对 物理 存储 器 的 访问 操作 。 一 次 是 引用 页 表 ， 而 另 一 次 是 访问 要 请 
求 的 实际 数据 。 读 者 很 容易 理解 这 两 次 操作 是 如 何 影响 有 效 存 取 时 间 的 。 假 设 访问 一 次 主 存储 器 需要 的 
时 间 为 200ns， 可 能 产生 的 缺 页 率 为 1% 。 也 就 是 说 ， 其 中 99% 的 时 间 处 理 器 都 可 以 在 存储 器 中 找到 所 需 
要 的 页 。 再 假设 每 次 引用 不 在 存储 器 中 的 页 时 ， 需 耗费 的 时 间 为 10ms。 这 个 10ms 时 间 包 括 了 将 缺 页 转 
移 到 存储 器 ， 更 新 页 表 ， 以 及 引用 数据 所 需要 的 总 时 间 。 因 此 ， 该 存储 器 访问 的 有 效 存 取 时 间 为 : 

EAT=0. 99 (200 ns 十 200 ns) 十 0.01 (10 ms) = 100 396 ns 
即使 100%% 的 请 求 页 都 在 存储 器 中 ， 但 有 效 存 取 时 间 仍 然 有 : 
EAT=1.00 (200 ns 十 200 ns) = 400 ns 

即 有 效 存 取 时 间 实 际 上 为 存储 器 访问 时 间 的 二 倍 。 因 为 页 表 本 身 存放 在 主 存储 器 中 ， 所 以 访问 页 
表 也 会 耗费 掉 一 个 额外 的 存储 器 存 取 时 间 。 
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虚拟 地 址 空间 : 8KB=2” 
物理 存储 器 : 4KB=2” 
页 大 小 : ”1KB=2" 


物理 地 址 





0'= 1023 
: 1024- 2047 
2 2048'= 3071 
3072 = :4095 
5 S119 
: 5120 = 6143 
: 6144 - 7167 
L680 = BEI 


c) 地 址 


AONAW PO 
OMAWO OPO 
© 
\D 
CO 
1 








0000000100 
一 一 
帧 1 帧 0 缺 页 
d) 虚拟 地 址 5459 转换 成 物理 地 址 1363 e) 虚拟 地 址 2050 转换 成 物理 地 址 2 人 虚拟 地 址 4100 


图 6-16 一 个 较 大 规模 的 存储 器 的 例子 
通过 将 最 近 的 页 查询 数据 值 存放 到 一 个 被 称 为 转换 旁 视 缓冲 器 (translation look-aside buffer， 
TLB) 可 以 加 速 页 表 的 查询 时 间 。 每 个 TLB 的 入 口 目录 都 由 一 个 虚拟 页 的 页 码 和 对 应 的 物理 页 帧 的 帧 
数组 成 。 对 于 上 面 有 关 页 表 的 例子 ， 表 6-2 给 出 了 一 种 TLB 的 可 能 状态 。 
表 6-2 对 应 于 图 6-16 的 TLB 
的 当前 状态 








处 理 器 通常 使 用 关联 高 速 缓存 来 实现 TLB， 并 且 虚 拟 页 码 和 物理 页 帧 数 对 可 以 映射 到 TLB 高 速 组 
存 的 任何 位 置 。 当 使 用 TLB 时 (参见 图 6-17)， 一 个 地 址 的 查询 过 程 需要 有 如 下 的 步骤 : 
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1. 从 虚拟 地 址 中 提取 页 码 。 

2. 从 虚拟 地 址 中 提取 偏 移 量 。 

3. 在 TLB 中 搜索 虚拟 页 码 。 

4. 如 果 在 TLB 中 找到 虚拟 页 码 和 物理 页 帧 数 对 ， 则 将 偏 移 量 加 上 物理 页 帧 数 ， 并 直接 访问 相应 
的 存储 单元 。 

5. 如 果 发 生 一 个 TLB 缺失 ， 处 理 器 就 从 页 表 中 获取 所 要 求 的 帧 数 。 如 果 该 页 已 经 位 于 存储 器 中 ， 
就 利用 物理 页 帧 数 加 上 偏 移 量 的 方法 生成 对 应 的 物理 地 址 。 

6. 如 果 所 请 求 的 页 不 在 主 存储 器 中 ， 就 会 生成 一 个 缺 页 错误 。 在 完成 缺 页 事件 后 ， 需 重启 存储 器 
访问 操作 。 


页 缺失 (需要 
OS 介入 ) 





图 6-17 使 用 TLB 


6. 5.3 综合 举例 : 同时 使 用 高 速 缓存 、TLB 和 分 页 


由 于 TLB 本 质 上 就 是 一 个 高 速 缓存 ， 所 以 我 们 把 所 有 这 些 概念 放 在 一 起 可 能 会 引起 读者 的 混淆 。 
但 是 ， 对 于 这 类 完整 过 程 的 讨论 无 疑 会 有 助 于 读者 全 面 掌握 有 关 存 储 器 的 基本 思想 。 当 CPU 生成 某 个 
地 址 时 ， 指 的 是 相对 于 程序 本 身 的 一 个 地 址 ， 即 虚拟 地 址 。 在 进行 数据 取 回 的 处 理 之 前 ， 这 个 虚拟 地 
址 必须 要 转换 成 物理 地 址 。 实 现 这 种 地 址 间 的 转换 任务 有 两 种 方法 : (1) 通过 定位 搜索 最 近 使 用 的 高 
速 缓 存 中 的 地 址 对 (页 / 帧 对 )， 使 用 TLB 来 查找 所 要 求 的 页 帧 ; (2) 如 果 发 生 TLB 缺失 事件 ， 则 要 使 
罚 页 表 在 主 存储 器 中 查找 相应 的 页 帧 〈 通 常 在 该 过 程 中 会 对 TLB 进行 更 新 )。 将 这 个 找到 的 页 帧 数 和 
虚拟 地 址 中 给 出 的 偏 移 量 组 合 起 来 即 可 创建 物理 地 址 。 

这 时 ， 虚 拟 地 址 已 经 被 转换 为 对 应 的 物理 地 址 ， 但 该 物理 地 址 的 数据 还 并 没有 被 取 回 。 数 据 取 回 
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也 存在 着 两 种 可 能 性 :(1) 搜索 高 速 缓存 ， 查 找 要 求 的 数据 是 否 已 经 驻 留 在 高 速 缓存 中 ; (2) 如 果 发 生 
高 速 缓存 缺失 ， 处 理 器 必须 到 实际 的 主 存储 单元 中 取 回 数据 ， 这 个 过 程 通常 也 会 对 高 速 缓存 同时 进行 
数据 更 新 。 

图 6-18 给 出 了 同时 使 用 TLB、 分 页 和 高 速 缓存 存储 器 的 进程 。 


| 页 码 | 偏 移 量 | 


是 (提取 页 帧 ) 





重新 访问 
图 6-18 综合 举例 : 组 合 运 用 TLB、 页 表 、 高 速 缓存 和 主 存储 器 


6.5.4 分 页 和 虚拟 存储 器 的 优 缺 点 


第 6. 5. 2 节 讨论 了 在 访问 数据 时 ， 如 何 通 过 分 页 和 增加 一 次 额外 的 存储 器 引用 来 实现 虚拟 存储 器 。 
通过 使 用 TLB 高 速 缓存 来 存放 页 表 的 人口 目录 ， 可 以 减少 分 页 的 部 分 时 间 损 失 。 但 是 ， 即 使 在 TLB 
中 有 很 高 的 命中 率 ， 这 一 进程 仍旧 会 在 地 址 转换 上 造成 重大 的 开销 。 使 用 虚拟 存储 器 和 分 页 的 另外 一 
个 缺点 是 ， 需 要 消耗 额外 的 系统 资源 ， 即 需要 额外 的 存储 器 空间 来 存放 页 表 。 在 极端 情况 下 〈 例 如 运 
行 一 些 非常 大 的 程序 )， 页 表 会 占用 很 大 比例 的 物理 存储 器 。 对 于 这 类 问题 ， 有 一 种 解决 方案 就 是 对 页 
表 再 进行 分 页 ， 这 样 一 来 使 得 问题 变 得 更 加 复杂 。 此 外 ， 要 使 用 虚拟 存储 器 和 分 页 ， 还 必须 有 专门 的 
硬件 和 操作 系统 的 支持 。 

要 想 从 使 用 虚拟 存储 器 中 获 益 就 必须 降低 其 缺点 的 影响 ， 使 得 虚拟 存储 器 的 应 用 有 利于 提高 计算 
机 系统 的 性 能 。 但 是 ， 使 用 虚拟 存储 器 和 分 页 又 有 什么 优点 呢 ? 答案 非常 简单 : 运行 的 程序 不 再 受到 
已 有 物理 存储 器 容量 大 小 的 限制 。 虚 拟 存储 器 允许 系统 运行 虚拟 地 址 空间 比 实际 物理 存储 器 空间 大 的 
程序 。 实 质 上 ， 虚 拟 存储 器 允许 进程 可 以 和 该 进程 自身 共享 物理 存储 器 。 这 样 一 来 ， 编 写 程序 的 工作 
变 得 更 简单 了 ， 因为 程序 员 不 再 会 为 物理 地 址 空间 的 限制 而 烦恼 。 由 于 每 个 程序 需要 的 物理 存储 器 空 
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间 较 小 ， 因 此 虚拟 存储 器 可 以 同时 运行 更 多 的 程序 。 允 许 更 多 的 人 共享 同一 台 机 器 ， 这 使 得 系统 能 够 
处 理 总 的 地 址 空间 远 远 超 过 系统 物理 存储 器 空间 的 容量 ， 提 高 了 CPU 的 使 用 率 和 系统 处 理 能 力 。 

从 操作 系统 的 角度 来 看 ， 使 用 固定 大 小 的 页 帧 和 页 面 简化 了 存储 器 空间 的 分 配 和 地 址 的 安排 问题 。 
而 且 ， 分 页 也 允许 操作 系统 以 每 页 为 基础 实现 特定 的 任务 保护 (例如 ， 该 页 属于 用 户 X， 而 其 他 用 户 
不 得 访问 ) 和 共享 〈 例 如， 该 页 属于 用 户 X, 其 他 用 户 可 以 阅读 其 内 容 ) 。 


6.5.5 分 段 


虽然 分 页 是 目前 计算 机 系统 中 最 常用 的 方法 ， 但 并 不 是 实现 虚拟 存储 器 的 唯一 方法 。 某 些 系 统 使 
用 的 实现 虚拟 存储 器 的 第 二 种 方法 是 分 段 (segmentation) 机 制 。 与 分 页 不 同 ， 分 段 并 不 把 虚拟 地 址 空 
间 划 分 为 相等 的 、 大 小 固定 的 页 面 ， 同 时 将 物理 地 址 空间 也 划分 为 相同 大 小 的 页 帧 ， 而 是 将 虚拟 地 址 
空间 划分 为 多 个 长 度 可 变 的 逻辑 单元 ， 或 称 为 段 (segment)。 物 理 存储 器 不 再 进行 实际 的 空间 分 割 或 
分 区 。 当 需要 将 某 个 段 复制 到 物理 存储 器 时 ， 操 作 系统 会 自动 查找 足够 大 的 自由 存储 空间 块 来 存储 整 
个 段 。 每 个 段 都 有 一 个 表示 该 段 在 存储 器 中 的 位 置 的 基地 址 〈base address); 还 有 一 个 指示 段 的 大 小 
的 界限 (bound limit) 。 每 个 程序 都 是 由 若干 个 的 段 组 成 。 每 个 程序 也 都 有 一 个 相应 的 段 表 (segment 
table) ， 而 不 是 页 表 。 段 表 中 所 包含 的 只 是 每 个 段 的 基 址 和 界限 对 的 集合 。 

只 要 提供 段 号 和 段 内 偏 移 量 ， 就 可 以 转换 存储 器 的 访问 。 系 统 还 要 进行 错误 校 验 以 确保 偏 移 量 是 
在 允许 的 界限 之 内 。 如 果 偏 移 量 允许 ， 再 将 该 段 的 基地 址 值 (可 以 在 段 表 中 找到 ) 加 到 偏 移 量 上 面 ， 
由 此 产生 实际 的 物理 地 址 。 因 为 分 页 采用 的 是 固定 大 小 的 存储 空间 块 ， 而 分 段 使 用 的 是 逻辑 存储 空间 
块 ， 所 以 使 用 分 段 更 容易 实现 存储 空间 的 保护 和 共享 。 例 如 ， 程 序 的 虚拟 地 址 空间 可 以 被 划分 为 一 个 
代码 段 、 一 个 数据 段 、 一 个 堆栈 段 和 一 个 符号 表 段 。 每 个 段 的 长 度 大 小 各 不 相同 。 系 统 用 户 可 以 很 轻 
松 地 说 :“ 我 希望 与 大 家 共享 我 所 有 的 数据 ， 因 此 数据 段 对 每 个 人 来 说 都 是 可 访问 的 ”。 然 后 可 以 说 : 
“OK， 我 的 数据 存放 在 某 某 页 上 ， 现 在 已 经 找到 了 那 4 个 数据 页 。 其 他 用 户 可 以 访问 其 中 的 3 页 ， 而 
第 4 页 只 有 其 中 的 一 半 人 允许 其 他 用 户 访问 。” 

与 分 页 一 样 ， 分 段 也 有 存储 碎片 现象 。 分 页 产生 内 部 碎片 现象 ， 原 因 在 于 处 理 器 将 一 个 完整 的 页 
帧 配置 给 并 不 需要 占用 整个 页 帧 的 程序 。 另 外 ， 分 段 会 造成 外 部 碎片 (external fragmentation) 现象 。 
在 进行 分 段 配 置 和 解除 分 段 处 理 时 ， 存 储 器 中 的 自由 (空空 间 块 就 会 变 得 残缺 不 完整 。 最 后 ， 存 储 
器 中 就 会 留 下 许多 长 度 较 小 的 自由 空间 块 。 但 是 这 些 残缺 的 空间 块 的 大 小 都 不 足以 存放 一 个 整 程序 段 。 
外 部 碎片 和 内 部 碎片 的 区 别 在 于 ， 对 于 外 部 碎片 ， 存 储 器 上 总 的 空间 足够 分 配给 一 个 程序 进程 使 用 ， 
但 是 这 个 存储 空间 是 不 连续 的 ， 上 面 存在 着 大 量 容量 很 小 、 无 法 使 用 的 空洞 。 而 对 于 内 部 碎片 ， 册 于 
系统 将 过 多 的 存储 空间 分 配给 了 某 个 并 不 需要 如 此 大 空间 的 程序 进程 ， 所 以 无 法 使 用 多 余 的 空间 。 为 
了 应 对 外 部 碎片 的 问题 ， 系 统 可 以 使 用 某 种 类 型 的 碎片 收集 (garbage collection) 技术 。 这 种 处 理 技 术 
只 是 对 存储 空间 上 已 经 占用 的 信息 块 进行 重新 调整 配置 ， 将 磁盘 小 的 碎片 空间 组 合成 规模 较 大 的 可 利 
用 的 自由 空间 块 。 如 果 读 者 曾经 进行 过 硬盘 的 碎片 整理 ， 就 已 经 看 到 相似 的 处 理 过 程 : 将 硬盘 上 许多 
小 的 自由 存储 空间 收集 并 创建 少数 较 大 的 自由 空间 。 


6. 5.6 分 页 和 分 段 的 组 合 方式 


分 页 与 分 段 的 机 制 并 不 相同 。 分 页 是 基于 一 个 纯粹 的 物理 值 : 即 程序 地 址 和 主 存储 器 地 址 都 被 划 
分 为 相同 大 小 的 物理 空间 块 。 而 另 一 方面 ， 分 段 是 将 程序 的 逻辑 地 址 部 分 划分 为 长 度 可 变 的 不 同 分 区 。 
使 用 分 段 ， 用 户 可 以 知道 段 的 大 小 和 界限 ; 而 使 用 分 页 ， 用 户 并 不 知道 存储 空间 的 具体 划分 。 相 对 来 
说 ,分 页 技术 比较 容易 管理 。 当 所 有 的 元 素 都 具有 相同 大 小 时 ， 分 配 空间 、 释 放空 间 、 空 间 交 换 和 重 
新 部 署 等 操作 都 会 变 得 较为 方便 。 但是， 一 般 情况 下 分 页 的 数目 要 比分 段 数目 少 ， 这 意味 着 分 页 技术 
需要 更 多 的 系统 开销 ， 主 要 指 页 面 记录 和 页 面 转换 所 占用 的 资源 。 分 页 消除 了 外 部 碎片 问题 ， 而 分 段 
却 可 以 避免 内 部 碎片 问题 。 分 段 可 以 支持 实现 段 的 共享 和 保护 ， 而 对 于 分 页 则 很 难 做 到 这 些 。 
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很 明显 ， 分 页 和 分 段 的 方式 各 有 优点 ; 而 系统 也 不 是 只 能 使 用 其 中 的 一 种 方案 。 通常 ， 可 以 将 
这 两 种 方法 组 合 起 来 使 用 。 以 便 获 得 最 佳 的 效果 。 在 组 合 方式 中 ， 虚 拟 地 址 空间 被 分 割 成 一 些 长 度 
可 变 的 段 ， 而 这 些 段 又 被 划分 成 许多 固定 大 小 的 页 面 。 主 存储 器 的 物理 空间 也 对 等 地 划分 为 相同 大 
小 的 帧 。 

每 个 段 都 有 一 个 页 表 ， 这 就 是 说 每 个 程序 都 有 多 个 页 表 。 系 统 的 物理 地 址 被 划分 为 三 个 域 。 第 一 个 域 
是 段 域 ， 指 示 系 统 所 对 应 的 页 表 ， 第 二 个 域 是 页 码 ， 用 作 进 入 页 表 的 偏 移 量 。 第 三 个 域 是 页 内 的 偏 移 量 。 

使 用 分 段 和 分 页 的 组 合 方式 对 于 存储 器 的 管理 非常 有 益 ， 这 种 组 合 方法 既 可 以 从 用 户 的 角度 来 实 
现 分 段 管理 ， 也 可 以 从 系统 的 角度 实现 分 页 管理 。 


6.6 存储 器 管理 实例 


因为 奔腾 系列 处 理 器 具有 现代 存储 器 管理 的 显著 特征 ， 下 面 简 单 回顾 一 下 奔腾 处 理 器 是 如 何 处 理 
有 关 存 储 器 的 问题 。 

奔腾 处 理 器 使 用 32 位 虚拟 地 址 和 32 位 物理 地 址 。 奔 腾 结 构 的 分 页 功能 所 使 用 的 页 面 大 小 为 4KB 
或 4MB。 并 且 可 以 采用 分 页 和 分 段 管理 机 制 的 不 同 组 合 形式 : 包括 没有 分 段 和 分 页 的 存储 器 ; 有 分 
页 、 没 有 分 段 的 存储 器 ;有 分 段 、 没 有 分 页 的 存储 器 ; 以 及 分 段 和 分 页 组 合 方式 的 存储 器 系统 。 

奔腾 处 理 器 采用 两 级 高 速 缓存 ; Ll 和 L2， 它 们 都 使 用 一 个 32 位 大 小 的 存储 区 块 。L1 靠近 处 理 
器 ， 而 2 位 于 处 理 器 和 存储 器 之 间 。L1 实际 上 由 两 个 高 速 缓存 组 成 : 奔腾 处 理 器 〈 像 大 部 分 计算 机 
一 样 ) 将 L1 分 割 为 用 于 保存 指令 的 高 速 缓存 〈 称 为 TCache) 和 保存 数据 的 高 速 缓存 〈 称 为 D- 
Cache) 。 这 两 个 L1 Cache 都 使 用 了 一 个 LRU 位 来 处 理 高 速 缓存 块 的 置换 操作 。 每 个 Ll 都 有 一 个 
TLB ( 快 表 ): D-Cache 的 TLB 具 有 64 个 入口 目录 ,而 ICache 只 有 32 个 人 口 目 录 。 这 两 个 TLB 都 是 
利用 4 路 的 组 关联 映射 方式 ， 并 且 采 用 了 一 个 伪 LRU 置换 算法 。 而 L1 的 D-Cache 和 工 Cache 都 使 用 2 
路 的 组 关联 映射 方式 。L2 的 规模 可 以 从 512KB (早期 型 号 的 产品 ) 增加 到 1MB (后 期 型 号 的 产品 )。 
L2 Cache 与 两 个 L1 Cache 一 样 ， 都 是 采用 2 路 的 组 关联 映射 方式 。 

为 了 管理 对 存储 器 的 访问 操作 ， 奔 腾 处 理 器 的 Cache 和 L2 Cache 都 采用 MESI 高 速 缓存 的 一 致 性 
协议 。 每 一 路 高 速 缓 存 线 都 使 用 2 位 的 二 进 制 数 来 存储 下 列 MESI 状态 中 的 其 中 一 种 状态 : (1) M: 被 
修改 过 的 ， 即 高 速 缓 存 中 的 数据 与 对 应 的 主 存储 器 中 不 同 ; (2) E: 独占 的 ， 即 高 速 缓存 的 内 容 没 有 被 
修改 过 ， 并 且 与 主 存储 器 相同 ，(3) S: 共享 的 ， 即 高 速 缓存 的 线 / 块 可 以 与 其 他 高 速 缓存 的 线 / 块 共享 ; 
(4) TI， 无 效 的 ， 即 所 请 求 的 线 / 抉 都 不 在 高 速 缓存 中 。 图 6-19 给 出 了 奔腾 处 理 器 的 存储 器 的 层次 结构 。 


LI Cache:2 路 组 关联 , 单 LRU 
位 ，32 位 线 大 小 


L1 1 高速 缓存 
(8 或 16KB) 


si 


L1 DD 高 速 组 人 
(8 或 迹 颖 检 \ 





D 高 速 缓存 TLB:4 [高 速 缓存 TLB:4 
路 组 关联 ,64 路 组 关联 ,32 
个 入 口 目 录 个 人 口 目录 


图 6-19 奔腾 存储 器 的 层次 结构 
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这 里 只 是 对 奔腾 处 理 器 的 存储 器 和 存储 器 的 管理 方法 做 了 一 个 简要 基本 的 概述 。 有 兴趣 的 读者 ， 
可 以 参阅 本 章 后 面 的 深入 阅读 部 分 。 


本 章 小 结 


存储 器 是 按 层次 结构 的 组 织 的 存储 容量 较 大 的 存储 器 的 价格 比较 低廉 ， 但 速度 却 比 较 慢 ;而 容 其 较 小 
的 存储 器 系统 的 速度 比较 快 ， 但 却 价格 不 菲 。 一 个 典型 的 存储 器 层次 结构 一 般 包 括 : 高 速 缓存 、 主 存储 器 
和 辅助 存储 器 〈 通 常 为 磁盘 驱动 器 ) 。 局 部 性 的 原理 有 助 于 我 们 跨越 各 个 相 邻 的 不 同 层次 结构 之 间 的 间隔 ， 
将 存储 器 系统 构建 成 一 个 整体 结构 。 这 样 ， 对 于 程序 员 来 说 ， 看 到 的 是 一 个 很 大 且 非 常 快 的 存储 器 系统 ， 
而 无 需 考虑 这 种 层次 结构 中 不 同 层次 之 间 数 据 转移 的 细节 问题 。 

高 速 缓存 的 作用 实际 上 是 一 个 缓冲 器 ， 它 的 位 置 靠近 CPU。 可 以 利用 高 速 缓存 来 保存 最 频繁 使 用 的 主 
存储 器 中 的 信息 块 。 采 用 存储 器 层次 结构 的 其 中 的 一 个 目的 是 ， 和 希望 处 理 器 可 以 获得 一 个 非常 接近 高 速 组 
存 访问 时 间 的 存储 器 有 效 存 地 时 间 。 是 否 能 够 达到 这 一 目的 ， 还 要 取决 于 所 执行 的 程序 的 行为 特征 ， 高 速 
缓存 的 组 织 方式 和 容量 大 小 ， 以 及 高 速 缓存 的 置换 策略 。 处 理 器 要 引用 的 内 容 如 果 能 够 直接 在 高 速 缓存 中 
找到 ， 称 为 高 速 缓存 命中 ;如 果 在 高 速 缓存 中 找 不 到 ， 则 称 为 高 速 缓存 缺失 。 对 于 缺失 事件 ， 没 有 找到 的 
所 需 的 数据 必须 从 主 存储 器 中 提取 。 在 处 理 缺 失事 件 时 ， 处 理 器 会 将 包含 缺失 数据 的 整个 数据 块 从 主 存储 
器 调 到 高 速 缓存 中 。 

对 于 不 同 的 存储 器 地 址 ， 高 速 缓存 的 组 织 结构 决定 了 CPU 搜索 高 速 缓存 的 方式 。 高 速 缓 存 可 以 采用 不 
同方 式 的 组 织 结构 : 直接 映射 、 全 关联 的 映射 ， 或 者 是 组 关联 的 映射 方式 。 直 接 映 射 的 高 速 缓存 不 需要 使 
用 置换 算法 。 然 而 ， 全 关联 和 组 关联 的 映射 方式 ， 在 高 速 缓存 被 装 满 后 ， 都 必须 使 用 FIFO、LRU 或 者 是 
其 他 的 分 配 策略 来 确定 要 从 高 速 缓存 中 移 除 的 某 个 信息 块 ， 以 便 为 新 的 信息 块 留 出 存放 的 空间 。 采 用 LRU 
算法 可 以 取得 最 好 的 置换 效果 ， 但 实现 起 来 却 十 分 困难 。 

使 用 存储 器 的 层次 结构 的 另外 一 个 目的 是 ， 利 用 硬盘 本 身 来 扩充 主 存储 器 的 容量 ， 这 种 方法 也 称 为 虚拟 
存储 器 。 利 用 虚拟 存储 器 技术 ， 可 以 在 计算 机 上 运行 虚拟 地 址 空间 比 物理 存储 器 大 的 程序 。 虚 拟 存 储 器 技术 
还 允许 多 个 程序 进程 在 系统 中 并 行 运行 。 使 用 分 页 的 管理 机 制 可 以 实现 对 虚拟 存储 器 的 管理 。 但 是 分 页 的 方 
法 存在 一 些 缺 点 ， 包括 需要 消耗 额外 的 系统 资源 (例如 存放 页 表 所 需 的 资源 ) 和 增加 额外 的 存储 器 访问 操作 
(系统 首先 要 访问 页 表 )。 使 用 一 个 TLB ( 快 表 ) 高 速 缓存 来 存放 最 近 使 用 的 虚拟 地 址 和 物理 地 址 对 可 以 克服 
这 些 缺 点 。 虚 拟 存储 器 在 将 虚拟 地 址 转换 成 物理 地 址 时 ， 也 会 产生 转换 开销 (translation penalty)。 而 虚拟 存 
储 器 在 处 理 缺 页 事件 ， 即 所 请 求 的 页 在 当时 并 没有 驻 留 主 存储 器 而 是 在 磁盘 上 时 ， 也 会 导致 时 间 上 的 额外 损 
失 “〈 开 销 )。 虚 拟 存 储 器 和 主 存储 器 之 间 的 相互 关系 与 主 存储 器 和 高 速 缓存 之 间 的 关系 非常 相似 。 由 于 这 种 
相似 性 ， 高 速 缓存 存储 器 的 概念 和 TLB 的 概念 常常 容易 混 消 。 实 际 上 ，TLB 就 是 一 个 高 速 缓 仔 。 必 须 强 
调 的 是 ， 在 处 理 其 他 任何 事件 之 前 ， 必 须 首先 将 虚拟 地 址 转换 为 物理 地 址 ， 这 也 正 是 TLB 要 做 的 事情 。 虽 
然 高 速 缓存 存储 器 和 使 用 分 页 的 虚拟 存储 器 看 起 来 很 相似 ， 但 它们 要 实现 的 目的 是 完全 不 同 的 。 使 用 高 速 
缓存 的 目的 是 为 了 改善 对 主 存储 器 的 有 效 存 取 时 间 ， 而 分 页 的 使 用 是 为 了 扩充 主 存储 器 的 存储 容 其 。 
深入 阅读 

要 学 习 有 关 RAM 的 更 多 的 内 容 ， 可 以 阅读 Mano (1991) 和 Stallings (2000) 的 著作 。Hamacher， 
Vranesic 和 Zaky (2002) 在 他 们 的 书 中 深入 讨论 了 高 速 缓存 存储 器 。 对 于 虚拟 存储 器 ， 可 以 参阅 Stallings 
(2001) ，Tanenbaum (1999) ， 或 Tanenbaum 和 Woodhull (1997) 的 著作 。 如 果 想 了 解 有 关 存 储 器 管理 的 
更 多 知识 ， 可 以 查阅 Flynn 和 MecHoes (1991) ，Stallings (2001) ，Tanenbaum 和 Woodhull (1997)， 或 Sil- 
berschatz，Galvin 和 Gagne (2001) 的 书籍 。Hennessy 和 Patterson (1996) 讨论 了 有 关 决 定 高 速 缓存 性 能 
的 问题 。 有 关 存 储 器 技术 的 在 线 课 程 可 以 浏览 网 页 www. kingston. com/tools/umg。 George Mason 大 学 同 
样 也 提供 了 一 系列 有 关 各 种 计算 机 课题 的 工作 平台 。 对 于 虚拟 存储 器 的 工作 平台 ， 可 以 访问 网 址 : 


cne, gmu. edu/ workbenches/vmsim/vmsim. html。 
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基本 概念 和 术语 复习 


、 SRAM 和 DRAM 哪 一 个 速度 更 快 ? 

. 主 存储 器 使 用 DRAM 有 什么 好 处 ? 

. 举 出 经 常 使 用 ROM 的 三 种 不 同 应 用 。 

. 解释 存储 器 层次 结构 的 基本 概念 。 为 什么 本 书 会 把 存储 器 的 层次 结构 描述 为 金字 塔 的 形式 ? 

. 解释 引用 局 部 性 的 概念 ， 并 且 疮 述 局 部 性 原理 对 于 存储 器 系统 的 重要 性 。 

. 计算 机 中 存在 哪 三 种 形式 的 局 部 性 ? 

.列举 两 个 非 计算 机 的 高 速 缓 存 的 例子 。 

， L1 Cache 和 12 Cache; 哪 一 个 的 速度 更 快 ? 哪 一 个 的 规模 更 小 ， 为 什么 ? 

. 高 速 缓存 是 利用 其 进行 访问 的 ， 而 主 存储 器 是 利用 其 进行 访问 的 。 

10. 直接 映射 的 高 速 缓存 中 地 址 的 三 个 域 分 别 是 什么 ? 如何 使 用 这 些 域 来 访问 存放 在 高 速 缓存 中 的 一 个 数 
据 字 。 

11. 关联 存储 器 与 常规 的 存储 器 有 何 区 别 ? 其 中 哪 种 存储 器 价格 更 贵 ， 为 什么 ? 

12. 解释 全 关联 高 速 缓存 和 直接 映射 高 速 缓存 之 间 有 何 区 别 。 

13. 组 关联 高 速 缓存 是 如 何 将 直接 映射 高 速 缓存 的 思想 与 全 关联 高 速 缓存 的 思想 结合 在 一 起 的 ? 

14. 直接 映射 的 高 速 缓存 通常 被 认为 是 组 关联 高 速 缓存 中 的 组 块 大 小 为 1 的 一 种 特例 。 那 么 ， 完 全 关联 高 
速 缓存 又 会 是 组 关联 的 组 块 大 小 为 的 一 种 特例 。 

15. 组 关联 高 速 缓存 的 地 址 分 成 哪 三 个 域 ? 如 何 使 用 这 三 个 域 来 访问 高 速 缓存 中 的 某 个 存储 单元 ? 

16, 解释 说 明 本 书 中 所 介绍 的 四 种 高 速 缓 存 置换 策略 。 

17. 为 什么 最 佳 高 速 缓存 置换 策略 对 高 速 缓存 的 性 能 非常 重要 ? 

18. 采用 LRU 和 FIFO 置换 策略 对 高 速 绥 存 行为 可 能 产生 的 最 坏 情况 是 什么 ? 

19. 严格 来 说 ， 什 么 是 有 效 存 取 时 间 (EAT)? 

20. 说 明 如 何 导 出 有 效 存 取 时 间 的 公式 ? 

21. 在 什么 情况 下 ， 高 速 缓存 的 作用 会 很 差 ? 

22. 什么 是 脏 块 ? 
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23. 分 别 描述 两 种 高 速 缓存 写 策略 的 优 缺 点 ? 
24. 虚拟 存储 器 地 址 和 物理 存储 器 地 址 有 何不 同 ? 哪 一 个 比较 大 ?” 为 什么 ? 
25， 分 页 的 目的 是 什么 ? 

26. 讨论 有 关 使 用 分 页 的 正 反 两 方面 的 意见 。 
27. 什么 是 缺 页 ? 

28. 造成 内 部 碎片 的 原因 是 什么 ? 

29. 虚拟 地 址 的 各 个 组 成 部 分 ( 域 是 什么 ? 
30. 什么 是 TLB? TLB 是 如 何 改 善 EAT 的 ? 
31, 虚拟 存储 器 有 何 优点 和 缺点 ? 

32. 什么 情况 下 ， 系 统 需 要 对 页 表 进 行 分 页 处 理 ? 
33. 什么 原因 会 造成 外 部 碎片 ? 如 何 解决 ? 


练习 题 


令 1. 假设 某 台 计 算 机 使 用 直接 映射 的 高 速 缓存 。 计 算 机 的 主 存储 器 的 容量 为 2" 字 ， 高 速 缓存 有 32 个 存储 空 
间 块 ， 且 每 个 高 速 缓存 块 包含 16 个 字 。 问 : 
al) 主 存储 器 可 以 划分 为 多 少 个 信息 块 ? 
令 b) 从 高 速 缓存 的 角度 来 看 ， 存 储 器 地 址 采用 的 是 什么 格式 ? 即 分 别 说 明 地 址 中 的 标记 域 、 块 域 和 字 域 
的 大 小 。 
@c) 存储 器 引用 时 ， 地 址 0DB63,6 将 会 被 映射 到 高 速 缓存 中 的 哪个 空间 块 ? 
2. 假设 某 台 计算 机 使 用 直接 映射 的 高 速 缓存 ， 计 算 机 的 主 存 储 器 的 容量 为 22 字 ， 高 速 缓存 有 1024 个 存储 
空间 块 ， 且 每 个 高 速 缓存 块 包含 32 个 字 。 问 : 
a) 主 存储 器 可 以 划分 为 多 少 个 信息 块 ? 
b) 从 高 速 缓存 的 角度 来 看 ， 存 储 器 地 址 采用 的 是 什么 格式 ? 即 分 别 说明 地 址 的 标记 域 、 块 域 和 字 域 的 
大 小 。 
c) 存储 器 引用 时 ， 地 址 00063FAis 将 会 被 映射 到 高 速 缓存 的 哪个 空间 块 ? 
令 3. 假设 某 台 计 算 机 使 用 全 关联 高 速 缓存 ， 其 主 存储 器 的 容量 为 25 字 ， 高 速 缓存 中 有 64 个 存储 空间 块 ， 每 
个 高 速 缓存 块 包含 有 32 个 字 。 问 ， 
令 a) 主 存储 器 中 有 和 多少 个 信息 块 
令 b) 高 速 缓存 可 以 看 到 的 存储 器 地 址 格式 是 什么 样 的 ? 即 分 别 说 明 地 址 的 标记 域 、 块 域 和 字 域 的 大 小 。 
令 c) 存储 器 引用 时 ， 地 址 F8C9,e 将 会 被 映射 到 高 速 缓存 的 哪个 存储 空间 块 ? 
4. 假设 某 台 计 算 机 使 用 全 关联 高 速 缓存 ， 其 主 存 储 器 的 容量 为 2* 字 ， 高速 缓 存 有 128 个 存储 空间 块 ， 每 
个 高 速 缓存 块 包 含 64 个 字 。 问 ， 
a) 主 存储 器 中 有 多 少 个 信息 块 ? 
b) 高 速 缓存 可 以 看 到 的 存储 器 地 址 的 格式 是 什么 样 的 ? 即 分 别 说 明 地 址 的 标记 域 、 块 域 和 字 域 的 大 小 。 
c) 存储 器 引用 时 ， 地 址 01D872ie 将 会 被 映射 到 高 速 缓存 的 哪个 存储 空间 块 ? 
令 5. 假设 系统 的 存储 器 有 128MB 字 ， 块 长 度 为 64 个 字 ， 高 速 缓存 由 32KB 块 组 成 。 如 果 使 用 2 路 的 组 关联 
高 速 缓 存 的 映射 方式 ,说明 主 存储 器 地 址 的 格式 ， 并 确定 地 址 中 的 各 个 域 和 域 的 大 小 。 
6. 一 个 由 4 个 块 组 构成 的 2 路 的 组 关联 高 速 绥 存 。 主 存储 器 有 2KB 块 ， 每 块 包含 8 个 字 。 
a) 说 明 主 存储 器 的 地 址 格式 ， 可 以 利用 这 种 格式 将 主 存储 器 地 址 映射 到 高 速 缓存 存储 器 ， 并 确定 地 址 中 
的 各 个 域 和 域 的 大 小 。 
b) 如 果 一 个 程序 执行 三 次 从 主 存储 器 单元 8 到 51o 的 循环 操作 ， 请 计算 其 命中 率 。 这 里 可 以 使 用 分 数 
的 形式 来 表示 命中 率 。 
7. 假设 某 台 计 算 机 采用 组 关联 高 速 缓存 ， 其 主 存储 器 的 容量 为 22 字 ， 高 速 缓存 有 32 个 存储 空间 块 ， 并 且 
每 个 高 速 缓 存 块 包 含 8 个 字 。 问 : 
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a) 如 果 高 速 缓存 为 2 路 的 组 关联 高 速 缓存 ， 那 么 从 高 速 缓存 的 角度 来 看 ， 主 存储 器 的 地 址 是 什么 格式 ? 
其 中 ,标记 域 、 组 域 和 字 域 的 长 度 分 别 是 多 少 位 ? 
b) 如 果 高 速 缓存 为 4 路 的 组 关联 高 速 缓存 ， 那 么 高 速 缓存 所 看 到 的 存储 器 的 地 址 是 什么 格式 ? 


. 假设 某 台 计算 机 采用 组 关联 高 速 缓存 ， 其 主 存储 器 的 容量 为 22 字 ， 高 速 缓存 有 64 个 存储 空间 块 ， 每 个 


高 速 缓存 块 包含 4 个 字 。 问 : 

a) 如 果 高 速 缓存 为 2 路 的 组 关联 高 速 缓存 ， 那 么 从 高 速 缓存 的 角度 来 看 ， 主 存储 器 的 地 址 是 什么 格式 ? 
其 中 ， 标 记 域 、 组 域 和 字 域 的 长 度 分别 是 多 少 位 ? 

b) 如 果 高 速 缓存 为 4 路 的 组 关联 高 速 缓存 ， 那么 高 速 组 存 所 看 到 的 存储 器 的 地 址 是 什么 格式 ? 

假设 某 台 计 算 机 使 用 一 个 8 位 长 度 的 存储 器 地 址 字 。 计 算 机 还 有 一 个 16 字 节 的 高 速 缓存 ， 其 中 每 个 高 

速 缓存 块 包含 4 个 字 节 。 在 一 个 程序 的 运行 过 程 中 ， 计 算 机 需要 访问 若干 数目 的 存储 器 单元 。 

现在 假设 ， 系 统 采用 的 是 直接 映射 的 高 速 缓存 ， 从 高 速 缓存 所 看 到 的 存储 器 地 址 格式 为 : 





程序 执行 时 ， 系 统 将 按照 如 下 的 顺序 访问 存储 器 地 址 〈 用 十 六 进 制 表 示 ): 6E，B9，17，E0，4FE， 
4F，50，91，A8，A9，AB，AD，93 和 94。 现 在 ， 假 设 前 4 个 访问 的 存储 器 地 址 已 经 装 人 到 高 速 缓存 
块 中 ， 如 下 图 所 示 。 其 中 ， 标 记 域 的 内 容 使 用 二 进 制 数 来 表示 ， 而 高 速 缓存 块 中 的 内 容 部 分 只 是 简单 地 
写 上 存放 在 该 高 速 缓存 单元 的 主 存储 器 地 址 。 问 : 


标记 域 高 速 缓存 中 的 内 容 标记 域 。 ”高 速 缓存 中 的 内 容 
的 内 容 人 地 站 代表 的 内 容 (用 地 址 代表 ) 





a) 在 上 述 的 存储 器 引用 的 整个 顺序 过 程 中 的 命中 率 是 多 少 ? 

b) 当 最 后 的 一 个 地 址 访问 结束 后 ， 存 储 器 中 的 哪个 数据 块 会 存放 在 高 速 缓 存 中 ? 

一 个 使 用 直接 映射 的 高 速 缓存 由 8 个 存储 空间 块 组 成 。 主 存储 器 有 4KB 数据 块 ， 每 块 包含 8 个 数据 字 。 

对 高 速 缓存 的 访问 时 间 为 22ns， 而 将 数据 块 从 主 存储 器 装 人 到 某 个 高 速 缓存 条 所 需要 的 时 间 是 300ns 

(这 一 时 间 包 括 了 系统 确定 高 速 缓存 缺失 块 和 将 相关 内 容 调 入 高 速 缓存 的 时 间 )。 假 设 系统 总 是 并 行 地 

开始 向 高 速 缓存 和 主 存储 器 发 出 访问 请 求 。 因 此 ， 如 果 在 高 速 缓存 中 未 找到 所 请 求 的 项 目 ， 系 统 并 不 

会 将 这 个 高 速 缓存 的 搜索 时 间 增 加 到 存储 器 的 访问 时 间 上 。 如 果 在 高 速 缓存 中 没有 找到 某 个 信息 块 ， 

则 系统 将 整个 块 都 装 入 到 高 速 缓存 中 ， 并 且 重 新 访问 存储 器 。 最 初 ， 高 速 缓存 是 空 的 。 

a) 说 明 主 存储 器 的 地 址 烙 式 ， 能 够 利用 这 种 地 址 格式 实现 从 主 存储 器 到 高 速 缓存 的 映射 。 确 定 地 址 域 
的 划分 和 域 的 大 小 。 

b) 如 果 一 个 程序 执行 从 主 存储 器 单元 0 到 67 的 4 次 循环 操作 ， 请 计算 其 命中 率 。 

c) 计算 程序 的 有 效 存 取 时 间 。 


. 考虑 一 个 按 字 节 编 址 的 计算 机 系统 ， 它 具有 24 位 地 址 ， 一 个 可 以 共存 放 64KB 数据 的 高 速 缓存 存储 器 ， 


以 及 32 字 节 的 块 。 对 于 如 下 的 高 速 缓存 方式 ， 给 出 24 位 存储 器 地 址 的 格式 : 
a) 直接 映射 

b) 关联 

c) 4 路 组 关联 
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12. 假设 某 个 进程 的 页 表 有 如 下 〈 左 ) 入 口 目 录 。 采 用 图 6-15a 中 的 格式 ， 指 出 该 进程 的 各 页 在 存储 器 中 的 
位 置 。 

令 13. 假设 某 个 进程 的 页 表 有 如 下 〈 右 ) 入 口 目录 。 采 用 图 6-15a 中 的 格式 ， 指 出 该 进程 的 各 页 在 存储 器 中 的 
位 置 。 





* 14， 一 个 虚拟 存储 器 配 有 一 个 2 入口 的 TLB， 一 个 2 路 组 关联 的 高 速 缓存 ， 以 及 一 个 进程 P 的 页 表 。 假设 
高 速 缓存 块 的 大 小 为 8 个 字 和 页 面 的 大 小 为 16 个 字 。 在 下 面 的 系统 中 ， 主 存储 器 被 划分 为 若干 个 数据 
块 ， 其 中 每 个 数据 块 都 由 一 个 字母 表示 。 两 个 块 等 于 一 个 页 帧 。 


兴 
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进程 P 的 
虚拟 存储 器 





如 果 系统 的 状态 如 上 所 示 ， 试 回答 下 列 问 题 : 

a) 进程 P 的 虚拟 地 址 为 多 少 位 ? 为 什么 ? 

b) 物理 地 址 为 多 少 位 ? 为 什么 ? 

c) 求 出 虚拟 地 址 18i 的 地 址 格式 〈 指 定 域名 和 大 小 )， 系 统 使 用 这 个 地 址 格式 向 物理 地 址 进行 转换 操 
作 ， 并 随后 将 这 个 如 拟 地 址 转换 成 相应 的 物理 地 址 。 (提示 : 先 将 18 转换 为 等 效 的 二 进 制 数 ， 然 后 
将 地 址 划分 为 对 应 的 域 )。 解 释 各 个 域 如 何 转换 为 对 应 的 物理 地 址 。 

d) 如 果 已 知 虚拟 地 址 6io 转 换 为 物理 地 址 54ie 。 给 出 物理 地 址 的 形式 〈 说 明 域名 和 大 小 )。 通 过 这 个 地 
址 形式 可 以 确定 该 地 址 在 高 速 缓存 中 的 位 置 。 并 解释 如 何 利用 该 地 址 形式 来 确定 物理 地 址 541, 在 高 
速 缓存 中 的 位 置 (提示 : 将 54 转换 为 二 进 制 数 ， 并 分 为 对 应 的 域 ) 。 

e) 如 果 已 知 虚拟 地 址 25o 位 于 虚拟 页 的 第 1 页 ， 偏 移 量 为 9 的 位 置 。 正 确 指 出 该 虚拟 地 址 如 何 被 转换 





15. 
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为 对 应 的 物理 地 址 ， 以 及 如 何 访问 所 要 求 的 数据 。 答 案 中 应 该 包括 如 何 使 用 TLB、 页 表 、 高 速 缓存 
和 存储 器 。 

已 知 一 个 虚拟 存储 器 有 一 个 TLB、 一 个 高 速 缓存 和 一 个 页 表 。 并 做 出 如 下 的 各 种 假设 : 

。 一 次 TLB 命中 需要 5ns。 

。 一 次 高 速 缓存 命中 需要 12ns。 

。 一 次 存储 器 的 调用 党 要 25ns。 

。 一 次 磁盘 的 调用 需要 200ms〈 此 时 间 包 括 更 新 页 表 、 高 速 缓存 和 TLB 的 时 间 )。 

， TLB 的 命中 率 为 90% 。 

*。 高 速 缓存 的 命中 率 为 98%。 

。 页 出 错 率 为 0.001%。 

“对 于 一 次 TLB 或 高 速 缓存 的 缺失 事件 ， 访 问 存储 器 需要 的 时 间 包 括 了 TLB 和 或 者 高 速 缓存 的 更 新 时 
间 ， 但 是 不 会 重启 访问 过 程 。 

* 对 于 一 次 页 错误 ， 缺 页 需要 从 磁盘 提取 ， 并 执行 所 有 的 更 新 过 程 ， 需 重启 访问 过 程 。 

。 所 有 的 引用 过 程 都 按 硕 序 进行 (没有 重 伙 发生 ， 也 没有 并 行 过 程 )。 

试 指出 下 面 的 各 种 情况 是 否 可 能 发 生 。 如 果 可 能 发 生 ， 求 出 访问 指定 数据 所 需要 的 时 间 ， 

a) TLB 命中 ,高速 缓存 命中 。 

b) TLB 缺失 ， 页 表 命 中 ， 高 速 缓 存 命中 。 

c) TLB 缺失 ， 页 表 命 中 ， 高 速 缓存 缺失 。 

d) TLB 缺失 ， 页 表 缺 失 ， 高 速 缓存 命 中 。 

e) TLB 缺失 ， 页 表 缺 失 。 

写 出 计算 有 效 访问 时 间 的 方程 式 。 

假设 某 个 系统 对 每 个 进程 都 采用 一 个 一 级 页 表 来 实现 分 页 的 虚拟 地 址 空间 。 虚 拟 地 址 空间 的 最 大 容量 

为 16MB。 运 行程 序 进程 的 页 表 包 含 如 下 的 合法 入 口 (符号 - 表示 某 个 虚拟 页 被 映射 到 给 定 的 页 帧 中 ， 

即 虚 拟 页 在 该 页 巾 中 的 位 置 ): 

虚拟 页 2 一 页 帧 4 虚拟 页 4 一 页 蚌 9 虚拟 页 1 路 页 帧 2 

虚拟 页 3 一 页 帧 16 虚拟 页 0 一 页 四 1 

如 果 页 面 大 小 为 1024 字 节 ， 并 且 机 器 的 最 大 物理 存储 器 容量 为 2MB。 

) 每 个 虚拟 地 址 需要 用 多 少 位 表示 ? 

b) 每 个 物理 地 址 需要 用 多 少 位 表示 ? 

c) 页 表 中 的 最 大 人 口 数 自 是 多 少 ? 

d) 虚拟 地 址 152416 转 换 为 哪个 对 应 的 物理 地 址 ? 

e) 什么 样 的 虚拟 地 址 可 以 转换 为 物理 地 址 10241。? 

a) 如 果 你 是 一 个 力图 使 自己 的 计算 机 系统 尽 可 能 地 具有 价格 上 竞争 优势 的 计算 机 制造 商 ， 你 会 选择 什 
么 样 的 功能 部 件 和 组 织 结构 来 构建 存储 器 结构 ? 

b) 如 果 你 是 一 个 想 要 获得 最 佳 性 能 的 计算 机 的 购买 者 ， 你 又 会 选择 什么 样 的 功能 部 件 和 组 织 结构 来 构 
建 存 储 器 结构 ? 

考虑 一 个 多 处 理 器 的 系统 ， 其 中 的 每 个 处 理 器 都 带 有 自己 的 高 速 缓存 ， 但 是 所 有 的 处 理 器 都 共享 一 个 

主 存储 器 系统 。 问 : 

a) 应 该 采用 哪 种 高 速 缓存 写 策略 ? 

b) 高 速 缓存 一 致 性 问题 : 设想 一 下 ， 对 于 这 个 多 处 理 器 系统 ， 如 果 其 中 一 个 处 理 器 的 高 速 缓存 中 存放 
存储 器 的 数据 块 A 的 副本 ， 而 在 第 二 个 处 理 器 的 高 速 缓存 中 也 有 同样 的 一 个 数据 块 A 的 副本 ， 然 
后 更 新 主 存储 器 的 数据 块 A， 会 产生 什么 问题 ? 设计 一 种 方法 〈 可 能 一 种 以 上 的 方法 ) 避免 这 种 情 
况 的 发 生 ， 或 降低 其 影响 。 

挑选 一 个 特定 的 体系 结构 〈 本 章 没有 介绍 的 体系 结构 ) 进行 仔细 研究 ， 揭 示 这 种 体系 结构 是 如 何 接近 

本 章 所 引入 的 那些 基本 概念 ， 就 像 Intel 公司 的 奔腾 处 理 器 所 做 的 那样 。 


EE 
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第 7 章 输入 /输出 和 存储 系统 


7.1 概述 


如 果 我 们 不 能 将 数据 输入 计算 机 并 从 计算 机 中 提取 信息 ， 那 么 这 种 计算 机 是 毫 无 用 处 的 。 拥有 一 
台 不 能 有 效 完成 输入 输出 操作 的 计算 机 ， 其 实 也 并 不 会 比 没有 计算 机 好 多 少 。 当 计算 机 的 处 理 时 间 超 
过 用 户 的 “思考 时 间 ” 时 ， 用 户 常常 会 抱怨 这 台 计 算 机 的 速度 太 “ 慢 "。 有 了 时， 计算 机 “ 慢 速 ”的 问题 
可 能 会 对 用 户 的 工作 效率 造成 实质 的 影响 ， 这 种 影响 的 程度 常常 可 以 用 金钱 来 衡量 。 但 是 ， 通常 引发 
这 种 问题 的 根源 并 不 在 处 理 器 或 内 存 ， 而 在 于 计算 机 如 何 处 理 系统 的 输入 和 输出 。 

1/O 不 仅仅 是 文件 的 存 取 。 一 个 性 能 不 佳 的 MO 系统 可 能 会 导致 某 种 连锁 反应 ， 降 低 整 个 计算 机 
系统 的 性 能 。 在 前 面 的 章节 里 ， 我 们 介绍 了 虚拟 存储 器 。 即 ， 系 统 如 何 利用 磁盘 对 存储 器 中 的 数据 块 
进行 页 面 调度 ， 以 便 在 主 存储 器 中 为 更 多 的 用 户 进程 设置 运行 空间 。 如 果 磁 盘 系 统 的 速度 很 慢 ， 那 么 
进程 执行 的 速度 也 就 会 减 慢 ， 由 此 导致 CPU 和 磁盘 队列 中 积压 很 多 未 执行 的 任务 。 解 决 这 个 问题 最 简 
单 的 办 法 是 增加 更 多 的 系统 资源 。 例 如 ， 购 买 更 大 的 主 存储 器 ， 更 快 的 处 理 器 。 如 果 在 增加 系统 资源 
方面 受到 限制 ， 则 可 以 简单 地 限制 计算 机 中 并 发 执行 的 进程 的 数量 。 

采用 这 些 简单 的 解决 方案 ， 难 免 会 造成 系统 资源 的 浪费 。 当 我 们 真正 理解 了 计算 机 系统 的 工作 过 
程 后 ， 就 可 以 最 有 效 地 利用 现 有 的 系统 资源 ， 而 只 是 在 真正 需要 的 时 候 才 会 添加 昂贵 的 资源 。 本 章 的 
目的 是 介绍 I/O 和 存储 系统 以 及 一 些 优化 系统 的 方法 ， 让 读者 能 够 对 磁盘 存储 系统 做 出 合适 的 选择 。 
本 书 最 大 的 愿望 是 大 家 能 使 用 这 些 内 容 作为 今后 进一步 学 习 的 一 个 跳板 一 一 甚至 可 以 进行 创新 工作 。 


7.2 AMDAHL 定律 


每 次 当 某 家 微 处 理 器 公司 发 布 其 最 新 和 最 强 的 CPU 时 ， 这 些 技术 上 的 飞 牙 都 会 成 为 全 球 媒体 的 焦 
点 。 全 球 的 计算 机 的 权威 人 士 也 认为 这 种 进步 应 该 值得 称赞 和 炫 净 。 然 而 ， 在 WO 技术 中 取得 类 似 的 
进步 时 ， 可 能 只 是 在 某 些 普 通商 业 杂 志 的 某 页 中 略 加 介绍 。 在 媒体 的 大 肆 泻 染 下 ， 人 们 很 容易 忽视 计 
算 机 系统 的 整体 特性 。 很 明 最 ， 计 算 机 中 某 个 部 件 的 速度 提升 40%， 肯 定 不 会 带 来 整个 系统 的 速度 提 
升 40%。 然 而 ,媒体 的 宣传 效果 却 常 常会 给 读者 造成 一 种 相反 的 错觉 。 

1967 年 ，George Amdahl 发 现 了 计算 机 中 组 成 部 件 与 计算 机 系统 的 整体 工作 效率 之 间 的 相互 关 
系 。Amdahl 使 用 了 一 个 公式 把 他 观察 的 结果 定量 化 ， 这 就 是 大 家 所 熟知 的 Amdahl 定律 。 从 实质 .上 来 
说 ，Amdahl 定律 表述 的 是 : 计算 机 系统 整体 性 能 的 速度 提升 〈 称 为 加 速率 ，speedup) 取决 于 某 个 特 
定 部 件 本 身 的 加 速率 和 该 部 件 在 系统 中 的 使 用 率 。 用 公式 表示 为 : 


-1 
Hike 


其 中 : 

S 代表 系统 整体 性 能 的 加 速率 ; 

了 表示 较 快 部 件 完 成 的 工作 部 分 ; 

& 是 新 部 件 的 加 速率 。 

假如 在 你 的 大 部 分 日 常 处 理工 作 中 计算 机 需要 花费 70% 的 时 间 来 执行 CPU 操作 和 30% 的 时 间 来 
等 待 磁盘 服务 。 现 在 ， 假 设 有 人 试图 卖 给 你 一 个 处 理 器 的 升级 换代 产品 ， 比 你 现 有 的 处 理 器 速度 快 
50% ， 价 格 是 10 000 美元 。 而 就 在 前 一 天 ， 曾 经 有 人 打 电 话 给 你 。 为 你 提供 一 组 价格 7000 美元 的 磁盘 
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驱动 器 。 这 种 新 磁盘 系统 的 吞吐 量 〈 处 理 能 力 ) 是 你 现 有 磁盘 系统 的 2. 5 倍 。 你 很 清楚 你 的 计算 机 系 
统 的 性 能 正在 开始 落伍 ， 因 此 你 想 要 做 某 些 升级 处 理 。 为 了 达到 用 最 少 的 钱 取得 最 大 的 性 能 改善 的 目 
的 ， 你 会 选择 上 面 的 哪 一 种 升级 方案 ? 

如 果 选 择 处 理 器 ， 有 : 


二 0.70,k 二 1.5, 所 以 S== 1 


07 T0715 一 
肉 此， 购买 新 的 处 理 器 要 花费 10 000 美元 ， 并 且 可 以 使 系统 整体 性 能 的 速度 提升 1. 3 倍 或 30%。 
如 果 选 择 磁 盘 ， 有 : 


一 0.30, 一 2.5, 所 以 S = 


1. 30 





A 1. 22 





1 

(1 一 0.3) 十 0.3/2.5 
即 磁盘 升级 的 花费 为 7000 美元 ， 所 带 来 的 系统 的 加 速率 是 1. 22 倍 或 22%。 

初 看 起 来 ， 这 两 种 选择 方案 的 效果 几乎 是 一 样 的 ， 很 难 做 出 决定 。 对 于 升级 处 理 器 的 方案 ， 系 统 
的 性 能 每 提升 1% 所 要 付出 的 代价 是 333 美元 。 而 通过 升级 磁盘 ， 每 增加 1% 的 系统 性 能 所 要 花费 的 代 
价 为 318 美元 。 如 果 仅 仅 基于 性 能 改善 的 每 个 百分点 所 花费 的 成 本 来 判断 的 话 ， 显 然 升 级 磁盘 驱动 器 
是 一 个 稍 好 的 选择 方案 。 当 然 ， 还 有 其 他 的 一 些 因 素 也 会 影响 到 你 的 决定 。 例 如 ， 磁 盘 寿 命 已 经 接近 
尾声 ， 或 者 磁盘 的 空间 已 经 耗 尽 。 这 种 情形 下 ， 即 使 升级 磁盘 比 升 级 处 理 器 的 费用 高 ， 你 也 可 能 会 优 
先 考虑 对 磁盘 进行 升级 。 

但 是 ， 在 决定 升级 磁盘 之 前 ， 最 好 先 了 解 清楚 其 他 选择 方案 。 下 面 内 容 将 介绍 通用 的 输入 输出 
(1/O) 体系 结构 ， 并 特别 强调 有 关 磁 盘 的 IO 系统 。 磁 盘 的 1/O 系统 紧 随 在 CPU 和 存储 器 之 后 ， 是 决 
定 计算 机 系统 的 整体 效能 的 重要 因素 。 


7.3 输入 /输出 体系 结构 


输入 /输出 《I/O) 定义 为 在 外 部 设备 和 由 CPU 及 主 存 储 器 组 成 的 主机 系统 之 间 移 动 编码 数据 的 一 
个 子 系统 部 件 。 输 入 输出 子 系统 包括 (但 不 限于 ) 以 下 部 分 : 

。 用 于 1/O 功能 的 主 存储 器 模块 

“提供 将 数据 从 系统 中 移 人 和 移出 所 需要 的 总 线 通道 

。 主 机 和 外 围 设备 中 的 控制 模块 

。 连 接 外 部 元 件 的 接口 ， 例 如 ， 连 接 键盘 和 磁盘 

， 连 接 主机 系统 和 外 围 设备 的 电缆 或 其 他 通信 和 链接 

图 7-1 描述 的 是 如 何 将 所 有 这 些 部 件 组 合 起 来 ， 构 成 一 个 集成 的 1/0 子 系统 。I/O 模块 主要 负责 
主 存储 器 和 某 个 特定 设备 的 接口 之 间 的 数据 传递 。 接 口 是 专门 设计 的 电路 ， 用 来 与 某 种 类 型 的 外 围 设 
备 通信 ， 例 如 键盘 、 磁 盘 或 打印 机 。 接 口 用 来 处 理 某 些 通信 方面 的 细节 问题 ， 比 如 确保 外 围 设备 已 经 
为 下 一 批 的 数据 传送 准备 就 绪 ， 或 者 确认 主机 已 经 准备 好 接收 来 自 外 部 设备 的 下 一 批 数 据 。 

在 发 送 设 备 和 接收 设备 之 间 交 换 的 各 种 信号 的 县 体形 式 和 信号 所 代表 意义 称 为 协议 〈proto- 
col) 。 协 议 包括 : 命令 信号 ,例如 “打印 机 重 置 ";， 状态 信号 ， 例如 “磁带 就 绪 ”; 或 数据 传递 信 
号 ,例如 “这 就 是 所 请 求 的 字 节 ”。 在 大 多 数 数据 交换 协议 中 ， 接收 设 备 必须 对 命令 和 发 送 过 来 
的 数据 做 出 应 答 ， 或 者 指示 接受 设备 已 经 准备 好 接收 数据 。 这 种 类 型 的 协议 交换 被 称 为 “握手 ” 
(handshake) 。 

负责 处 理 大 量 数据 信息 的 外 部 设备 〈 例 如 打印 机 、 磁 盘 和 磁带 驱动 器 ) 通常 都 有 缓冲 存储 器 。 缓 
冲 器 允许 主机 系统 以 尽 可 能 最 快 的 方式 将 大 量 数据 发 送 到 外 围 设备 中 ， 而 不 必 等 待 直到 慢 速 的 机 械 设 
备 实际 完成 数据 的 写 人 操作 。 磁 盘 驱动 器 的 专用 存储 器 通常 是 速度 很 快 的 高 速 缓存 ， 然 而 打印 机 上 通 
常 配备 较 慢 的 RAM。 

设备 控制 电路 负责 从 系统 的 缓冲 器 中 提取 或 输入 数据 ， 以 确保 在 需要 时 可 以 及 时 获取 数据 。 在 写 
磁盘 时 ,设备 控制 电路 的 工作 还 包括 对 磁盘 进行 合适 的 定位 以 确保 数据 可 以 写 到 某 个 特定 的 磁盘 区 域 。 
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图 7-1 1/O 结构 模型 的 基本 配置 
而 对 打印 机 来 说 ， 设 备 控制 电路 还 要 完成 将 打印 头 或 激光 束 移动 到 下 一 字符 位 置 上 ， 启 动 打印 头 ， 弹 
出 打印 纸 等 操作 。 
磁盘 和 磁带 属于 持久 性 存储 (durable storage) 的 形式 。 之 所 以 这 样 说 ， 是 因为 它们 与 易 失 性 的 主 
存储 器 相 比 ， 其 上 的 数据 可 以 保存 较 长 的 时 间 。 然 而 ， 没 有 一 种 存储 方法 是 永久 性 的 。 数 据 在 磁性 介 
质 上 可 以 保存 大 约 5 年 ， 而 在 光学 介质 上 大 约 能 保存 100 年 。 


7.3.1 MO 的 控制 方法 


计算 机 系统 通常 有 4 种 1/O 控制 方法 。 包括: 程序 控制 的 IO、 中 断 控制 的 IO、 直 接 存储 器 存 取 
和 通道 控制 的 JWO。 虽 然 这 些 方法 各 有 利弊 ， 但 是 计算 机 所 采用 I/O 的 控制 方法 将 会 严重 影响 系统 的 
整体 设计 和 性 能 。 我 们 的 目的 是 让 读者 了 解 特定 的 计算 机 体系 结构 中 所 采用 的 I/O 控制 方法 是 否 适合 
该 系统 的 应 用 方式 。 





使 用 程序 控制 的 IJO (programmed IO) 的 计算 机 系统 需要 为 每 个 IO 设备 至 少 准备 一 个 专用 的 
寄存 器 。CPU 会 持续 不 断 地 监视 每 个 寄存 器 ， 等 待 数 据 的 到 达 。 这 种 方法 称 为 轮 询 (polling)。 因 此 ， 
程序 控制 的 IO 有 时 也 被 称 为 轮 询 的 IO (polled MO) 。 一 旦 CPU 检测 到 某 个 “数据 就 绪 ” 的 条 件 ， 
就 会 根据 为 这 个 特定 寄存 器 所 准备 的 指令 执行 各 种 操作 。 

这 种 方法 的 好 处 是 可 以 通过 编程 来 控制 每 个 外 部 设备 的 行为 。 通 过 改变 程序 就 可 以 调整 系统 所 控制 

的 外 部 设备 的 数目 和 类 型 ， 以 及 轮 询 的 权限 和 时 间 间 隔 。 但 是 , 不断 地 对 寄存 器 轮 询 是 一 个 比较 麻烦 的 
问题 。 采 用 这 种 方式 工作 的 CPU 会 持续 处 于 一 个 “繁忙 等 待 〈busy wait)” 循 环 中 ， 直 到 开始 服务 某 个 
I/O 请 求 。 如 果 没 有 W/O 任务 要 进行 处 理 ，CPU 就 无 法 从 事 任何 有 用 的 工作 。 由 于 存在 着 这 些 限制 ， 程 
序 控制 的 1/O 最 适合 应 用 在 某 些 专用 系统 上 ， 例 如 自动 取款 机 和 一 些 用 来 控制 或 监视 外 部 事件 的 系统 。 
和 新 控制 的 1/O 

中 断 控制 的 1/O (intrrrupt-driven I/O) 与 程序 控制 的 MO 正好 相反 。 使 用 中 断 控制 方式 的 CPU 
不 再 需要 持续 地 查询 其 附属 设备 是 否 有 任何 输入 请 求 ， 而 是 在 有 数据 发 送 需 求 时 由 外 部 设备 来 通知 
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CPU。 如 果 没 有 外 部 设备 发 出 服务 请 求 来 中 断 CPU，CPU 就 可 以 继续 执行 其 他 任务 。 通 常 ， 系 统 使 用 
CPU 的 标志 寄存 器 中 的 一 个 二 进 制 位 来 指示 中 断 信 号 ， 该 位 称 为 中 断 标 志 (interrupt flag) 。 

一 旦 设置 了 中 断 标志 ， 操 作 系统 就 会 中 断 正 在 执行 的 程序 ， 并 保存 该 程序 的 状态 及 各 种 可 变 的 信 
息 。 然 后 ， 系 统 会 提取 有 关 指示 I/O 中 断 服务 程序 地 址 的 地 址 矢量 (address vector) 。 在 完成 IIO 中 断 
服务 后 ，CPU 会 恢复 中 断 发 生 时 所 保存 的 正在 执行 的 程序 的 信息 ， 并 且 重新 开始 继续 执行 原 程序 。 

中 断 控 制 的 XO 和 程序 控制 的 IO 的 相似 之 处 是 ， 它 们 都 可 以 对 1/O 服务 程序 进行 修改 来 适应 外 部 
硬件 设备 的 改变 。 对 于 运行 相同 类 型 和 级 别 的 操作 系统 的 计算 机 ， 属 于 各 种 不 同 硬件 类 型 的 地 址 矢量 通 
常会 保存 在 系统 中 的 相同 位 置 。 因 此 ， 我 们 很 容易 改变 这 些 地 址 矢量 ， 使 其 指向 专用 设备 的 代码 。 例 如 ， 
如 果 有 人 需要 使 用 一 种 新 型 的 磁盘 驱动 器 ， 但 是 目前 流行 的 操作 系统 并 不 支持 这 个 磁盘 驱动 器 。 那么 ， 
这 种 磁盘 驱动 器 的 生产 厂家 就 会 更 新 磁盘 1/O 地 址 矢量 ， 指 向 属于 这 个 磁盘 驱动 器 的 专用 代码 。 不 幸 的 是 ， 
一 些 早期 的 基于 DOS 的 病毒 制造 者 也 使 用 这 种 思想 。 他 们 常常 会 用 某 些 地 址 指示 器 来 蔡 代 DOS 的 MO 矢 
量 , 而 将 系统 引 向 他 们 自己 编写 的 恶意 代码 。 这 样 ， 会 影响 到 进程 中 的 许多 系统 。 许 多 当今 流行 的 操作 系统 
都 使 用 中 断 控制 的 1/O。 幸 运 的 是 ， 这 些 操作 系统 都 有 一 些 保护 机 制 来 防止 这 种 类 型 的 矢量 操作 。 





不 管 是 采用 程序 控制 的 IO， 还 是 中 断 控 制 的 IO，CPU 都 要 从 I/O 设备 移 人 和 移出 数据 。 在 MO 
过 程 中 ，CPU 会 运行 一 些 类 似 如 下 伪 代 码 的 指令 : 


WHILE More-input AND NOT Error 
ADD 1 TO Byte-count 
IF Byte-count > Total-bytes-to-be-transferred THEN 
EXIT 
ENDIF 
Place byte in destination buffer 
Raise byte-ready signal 
Initialize timer 
REPEAT 
WAIT 
UNTIL Byte-acknowledged, Timeout, OR Error 
ENDWHILE 


很 明显 ， 这 些 指令 非常 简单 ， 完 全 可 以 使 用 某 个 专用 芯片 来 编程 。 这 就 是 直接 存储 器 存 取 (direct 
memory accessy DMA》 的 思想 来 源 。 如 果 一 个 系统 使 用 DMA， 那 么 CPU 就 不 再 需要 执行 元 长 的 1/0 
指令 。 为 了 有 效 地 传送 数据 ，CPU 必须 为 DMA 控制 器 提供 要 传输 数据 字 节 的 地 址 、 字 节 数 ， 以 及 目 
标 设备 或 存储 器 地 址 。 这 种 通信 联系 通常 要 利用 CPU 上 的 专用 1/O 寄存 器 来 完成 。 典 型 的 DMA 结构 
示意 图 如 图 7-2 所 示 。 





图 7-2 DMA 配置 示例 
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一 日 在 存储 器 中 装 人 了 所 要 求 的 数值 后 ，CPU 就 会 发 送信 号 到 DMA 子 系统 。 由 DMA 来 负责 
IO 的 细节 过 程 ， 而 CPU 会 继续 执行 其 下 一 个 任务 。 在 完成 IO 处 理 后 (或 者 是 由 于 出 错 而 结束 MO 
操作 ) ，DMA 子 系统 会 发 送 另 一 次 中 断 请 求 通知 CPU。 

由 图 7-2 可 见 ，DMA 控制 器 和 CPU 共享 存储 器 总 线 。 任 一 时 刻 ， 两 者 之 中 只 能 够 有 一 个 设备 控制 
这 条 总 线 。 也 就 是 说 ， 成 为 总 线 主 控 设 备 〈bus master) 。 一 般 来 说 ，I/O 操作 要 比 CPU 从 内 存 中 提取 程 
序 指令 和 数据 的 优先 级 高 ， 原 因 在 于 许多 I/O 设备 的 操作 都 限制 在 非常 紧凑 的 时 间 参 数 内 。 如 果 在 特定 
的 时 间 周 期 内 没有 检测 到 有 事件 发 生 ， 这 些 VO 设备 就 会 被 强制 起 时 休息 〈timeout)， 并 中 止 当前 的 1/0 
进程 。 为 了 避免 WO 设备 发 生 超 时 休息 的 情况 ，DMA 会 利用 平时 由 CPU 使 用 的 存储 器 周期 来 完成 IO 
操作 。 这 种 现象 称 为 周期 窃取 (cycle stealing) 。 幸 运 的 是 ， I/O 趋向 于 在 总 线 上 产生 突 发 式 (bursty) 的 
传输 ， 即 成 块 或 成 组 地 发 送 数据 。 在 这 种 突 发 式 传输 的 间 辽 ，CPU 将 会 被 授权 访问 总 线 。 由 于 这 种 总 线 
的 访问 过 程 不 会 持续 很 长 的 时 间 ， 因 此 人 们 不 会 抱怨 系统 是 在 “IO 过 程 中 怜 行 "。 





在 数据 传输 过 程 中 ， 程 序 控制 的 1/O 每 次 传输 一 个 字 节 。 中 断 控制 的 1/O 每 次 可 以 按 一 个 字 节 ， 或 
者 是 小 数据 块 的 形式 来 处 理 数 据 ， 具 体 的 形式 取决 于 参与 1/O 过 程 的 设备 类 型 。 通 常 ， 速度 较 慢 的 设备 ， 
例如 键盘 ， 传 输 相 同 字 节 数 的 数据 要 比 磁盘 驱动 器 和 打印 机 产生 更 多 的 中 断 过 程 。 DMA 方法 是 面向 数据 
块 的 VO 处 理 方式 ， 它 只 是 在 一 组 字 节 的 传输 完成 〈 或 失败 ) 后 才 会 中 断 CPU。 在 DMA 发 送 1/O 完成 
的 信号 后 ，CPU 会 给 出 下 一 个 要 读 取 或 写 人 的 内 存 地 址 。 而 在 传输 失败 的 事件 中 ，CPU 会 独自 做 出 适当 
的 响应 。 因 此 ，DMA 的 IVO 与 中 断 控制 的 IO 相 比 ， 只 需要 很 少 的 CPU 参与 。 对 于 小 型 单 用 户 计算 机 
系统 来 说 ， 这 种 DMA 方式 的 管理 开销 很 低 ， 而 对 于 大 型 多 用 户 的 计算 机 系统 〈 比 如 大 型 机 ) 来 说 ， 管 
理 开 销 并 不 是 很 经 济 。 大 部 分 大 型 计算 机 都 采用 1/O 〇 通道 〈I/O channel) 的 智能 型 DMA 接口 。 

利用 通道 控制 的 I/O 《channel IO) ， 一 个 或 多 个 的 IO 处 理 器 可 以 控制 多 条 不 同 的 IO 路径， 这 
些 路 径 被 称 为 通道 路 径 (channel path) 。 对 于 “ 慢 速 ” 设 备 ， 如 终端 设备 和 打印 机 ， 通 道路 径 可 以 组 
合 在 一 起 〈 复 用 ，mnultiplex) ， 人 允许 几 个 这 类 的 设备 仅仅 通过 一 个 控制 器 来 进行 管理 。 在 IBM 的 大 型 
计算 机 中 ， 一 个 多 路 复 用 的 通道 路 径 被 称 为 多 路 复 用 器 通道 (multiplexor channel) 。 而 服务 于 磁盘 控 
制 器 和 其 他 “快速 ”设备 的 通道 称 为 选择 器 通道 (selector channel) 。 

I/O 通道 由 一 些 被 称 为 I/O 处 理 器 (1/O processors，IOP) 的 小 CPU 来 控制 ， 这 些 CPU 是 专门 
为 1/O 优化 设计 的 。 不 像 DMA 的 控制 电路 ，IOP 具有 执行 程序 的 能 力 ， 包括 执行 算术 逻辑 指令 和 分 
支 转移 指令 。 图 7-3 描述 了 一 个 简化 的 通道 控制 的 IO 的 配置 。 
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IOP 执行 由 主机 处 理 器 放置 在 主 系统 存储 器 中 的 程序 。 这 些 程序 ， 由 一 系列 通道 命令 字 (channel 
command words，CCW) 组 成 ， 不 但 包括 实际 的 传输 指令 ， 还 包括 控制 IO 设备 的 命令 。 这 些 控 制 命 
令 中 包含 不 同类 型 设备 的 初始 化 ， 打 印 机 纸张 输出 和 磁带 倒 回 等 诸如 此 类 的 命令 。 一 旦 将 I/O 程序 放 
置 到 内 存 后 ， 主 机 的 处 理 器 将 发 出 一 个 启动 子 通道 (start sub-channel) 的 命令 (SSCH),， 通知 IOP 在 
哪里 可 以 找到 程序 的 内 存 地 址 。 在 IOP 完成 任务 后 ， 它 会 在 内 存 中 放置 任务 已 经 完成 的 信息 ， 并 且 向 
CPU 发 送 一 个 中 断 信 号 。 然 后，CPU 会 得 到 该 完成 信息 ， 并 针对 相应 的 返回 代码 做 出 动作 。 

独立 的 DMA 与 通道 控制 的 MO 的 主要 区 别 在 于 1/O 处 理 器 的 智能 特性 。IOP 能 够 对 协议 进行 协 
商 ， 发 出 各 种 设备 命令 ， 将 存储 译 码 转换 为 内 存 译 码 ， 并 可 以 独立 于 主机 的 CPU 来 传输 多 个 完整 的 文 
件 或 文件 组 。 而 主机 只 负责 为 /O 操作 创建 程序 指令 ， 以 及 通知 IOP 在 哪里 能 找到 这 些 程序 指令 。 

像 独 立 DMA 一 样 ， 一 个 IOP 必须 从 CPU 中 窃取 存储 器 周期 。 但 与 独立 DMA 所 不 同 的 是 ， 通 道 
控制 的 IO 系统 都 配备 单独 的 总 线 ， 用 来 帮助 隔离 主机 和 I/O 操作 。 例 如 ， 如 果 从 磁盘 中 拷贝 一 个 文 
件 到 磁带 ，IOP 仅仅 会 在 从 主 存储 器 提取 指令 时 ， 才 使 用 系统 存储 器 总 线 。 余 下 的 数据 传输 部 分 只 需 
使 用 I/O 总 线 来 完成 。 由 于 具有 智能 性 和 总 线 隔离 性 的 优点 ， 通 道 控制 的 I/O 通常 在 高 吞吐 量 的 事务 
处 理 环境 中 使 用 。 在 这 种 情况 下 使 用 通道 控制 的 1/O 的 代价 和 复杂 性 是 合理 的 。 


7. 3.2 1/O 总 线 操作 


在 第 1 章 中 ,介绍 了 如 图 7-4 图 解 所 示 的 计算 机 总 线 体系 结构 。 该 图 表达 了 如 下 的 重要 思想 ; 

。 系统 总 线 是 一 个 由 计算 机 系统 中 多 个 组 件 共享 的 资源 。 

.必须 控制 对 该 共享 资源 的 访问 。 这 是 计算 机 系统 为 什么 需要 一 条 控制 总 线 的 原因 。 

通过 我 们 前 面部 分 的 讨论 ， 很 明显 存储 器 总 线 和 1/O 总 线 可 以 是 相互 独立 的 实体 。 事 实 上 ， 分 离 
这 两 条 总 线 通 常 是 一 个 很 好 的 想法 。 让 内 存 有 其 自己 的 总 线 的 一 个 好 的 理由 是 内 存 的 数据 传输 可 以 同 
步 (synchronous)， 这 时 系统 可 以 使 用 多 个 CPU 的 时 钟 周期 从 主 存储 器 中 检索 数据 。 在 一 个 功能 完善 
的 系统 中 ， 永 远 都 不 会 出 现 内 存 脱 机 ， 或 者 是 由 于 某 些 相同 类 型 的 错误 ， 比 如 打印 机 纸张 用 完 ， 而 困 
扰 外 围 设备 的 问题 。 


i 





图 7-4 一 个 系统 总 线 的 高 层次 视图 

从 另 一 方面 来 说 ，1/O 总 线 并 不 能 同步 操作 。 它 们 必须 要 考虑 1/O 设备 不 能 总 是 在 准备 处 理 IO 
传输 这 个 事实 。I/O 的 控制 电路 置 于 1/O 总 线 上 ， 并 且 在 1/O 设备 之 间 进 行 协商 以 决定 每 个 设备 可 能 
使 用 总 线 的 时 刻 。 因 为 这 些 握手 事件 在 每 次 总 线 被 访问 时 发 生 ， 所 以 I/O 总 线 也 称 为 异步 (asyn- 
chronous) 总 线 。 通 常 ， 区 分 同步 传输 和 异步 传输 的 方法 是 ， 同步 传输 要 求 传输 的 发 送 者 和 接收 者 共 
享 同一 个 公共 的 定时 时 钟 。 但 是 ， 异 步 总 线 协议 也 同样 要 求 有 一 个 时 钟 来 作为 位 定时 和 描绘 信号 转变 。 
在 我 们 学 习 了 一 个 例子 之 后 ， 这 种 观点 将 会 变 得 非常 清楚 。 

重新 考虑 图 7-2 中 的 配置 。 为 了 清晰 闻 述 ， 我 们 在 图 7-2 中 并 没有 将 数据 线 、 地 址 线 和 控制 线 分 开 
表示 。 对 于 DMA 电路 和 设备 接口 电路 之 间 的 连接 ， 图 7-5 表示 得 更 加 准确 ， 图 中 显示 了 单独 的 组 件 
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7-5 显示 地 址 总 线 数据 总 线 和 控制 总 线 的 DMA 配置 


图 7-6 给 出 了 磁盘 接口 电路 连接 三 种 总 线 的 细节 。 地 址 总 线 和 数据 总 线 分 别 由 一 组 单独 的 导线 构成 ， 
每 根 导线 可 以 传输 1 位 的 信息 。 数 据 线 的 数量 决定 了 总 线 的 宽度 (width)。 一 个 数据 总 线 有 8 条 数据 线 ， 
每 次 可 以 传送 1 字 节 的 数据 。 地 址 总 线 需 要 有 足够 多 数目 的 导线 来 唯一 地 识别 总 线 的 每 一 个 设备 。 


数据 总 线 
地 址 总 线 





图 7-6 ,磁盘 控制 器 接口 与 IO 总 线 的 连接 


7-6 中 的 一 组 控制 线 只 画 出 了 为 举例 说 明 所 需 的 最 少数 目的 控制 线 。 实 际 的 MO 总 线 通常 会 有 
多 于 12; 条 控制 线 (IBM 公司 早期 的 PC 机 的 控制 线 就 超过 了 20 条 )。 控 制 总 线 负责 协调 总 线 及 其 连接 
到 总 线 上 的 设备 。 为 了 将 数据 写 人 磁盘 驱动 器 中 ， 例 子 中 的 总 线 会 执行 如 下 的 操作 顺序 : 

1. DMA 电路 将 磁盘 控制 器 的 地 址 放置 地 址 线 上 ， 并 激活 (断言 有 效 ) Request 和 Write 信号 。 

2. 在 Request 信和 号 断言 确认 有 效 后 ， 控 制 器 中 的 译 码 电 路 会 查询 地 址 总 线 。 

3. 按照 所 查询 的 地 址 ， 译 码 器 启动 磁盘 控制 电路 。 如 果 磁 盘 的 写 人 数据 有 效 ， 控 制 器 就 会 在 
Ready 线 上 施加 一 个 信和 号 。 这 时 ， 就 完成 了 DMA 和 控制 器 的 握手 。 当 Ready 信号 升 起 后 ， 其 他 的 设 
备 就 不 可 以 使 用 总 线 。 

4. 然后 ，DMA 电路 会 将 数据 放 到 总 线 上 ， 并 且 撤 销 Request 信号 。 

5. 当 看 到 Request 信号 撤销 后 ， 人 磁盘 控制 器 将 字 节 从 数据 线 上 传送 到 磁盘 缓冲 器 中 ， 然 后 撤销 控 
磁盘 控制 器 的 Ready 信号。 

为 了 使 这 一 处 理 过 程 的 图 像 变 得 更 加 清晰 和 准确 ， 工 程 师 常 常会 使 用 时 序 图 (timing diagram) 来 
描述 总 线 操作 。 磁 盘 写 操作 的 时 序 图 如 图 7-7 所 示 。 图 中 标注 从 to 到 ti0 的 垂直 线 表示 不 同 信 号 的 持续 
时 间 。 在 实际 的 时 序 图 中 ， 一 个 精确 的 持续 时 间 将 被 划分 为 相等 的 时 间 间 隔 ， 通 常 间 隔 为 50 纳 秒 。 总 
线 上 的 信号 只 在 时 钟 周 期 转换 时 ， 才 会 发 生 改 变 。 注 意 ， 图 中 所 描述 的 各 种 信号 并 不 会 立即 上 升 和 下 
降 。 这 一 点 正 反应 了 总 线 的 物理 本 质 。 必 须要 有 少量 的 时 间 来 容许 信号 电 平 稳定 下 来 。 尽 管 这 个 稳定 
时 间 (settle time) 很 小 ， 但 是 在 一 个 长 时 间 的 1/O 转换 过 程 中 也 会 引起 一 个 大 的 延迟 。 
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图 7-7 总 线 时 序 图 
许多 实际 的 I/O 总 线 与 例 中 的 I/O 总 线 并 不 完全 相同 ， 它 们 常常 没有 单独 的 地 址 和 数据 总 线 。 由 
于 1/0O 总 线 具 有 异步 特征 ， 因 此 数据 线 也 能 用 来 保持 设备 的 地 址 。 因 此 ， 只 需 添 加 另外 的 一 条 控制 线 ， 
来 指示 数据 线 上 传输 的 信号 是 代表 一 个 地 址 还 是 数据 。 这 种 方法 与 存储 器 总 线形 成 了 鲜明 的 对 比 。 对 
于 存储 器 总 线 的 情形 ， 地 址 信号 和 数据 信号 必须 同时 有 效 。 


7.3.3 深入 讨论 中 断 控 制 的 1/0O 


至 此 ,我 们 已 经 假设 了 总 线 上 的 外 围 设备 在 收 到 命令 之 前 会 一 直 处 于 空 闪 状态。 在 小 型 计算 机 系 
统 中 ， 这 种 “ 仅 当 别人 对 你 讲话 你 才 说 话 ” 的 工作 方式 不 是 很 有 用 。 这 种 假设 暗示 了 所 有 的 系统 活动 
性 都 源 于 CPU， 即 由 CPU 引起 。 但 实际 上 ， 系 统 的 活动 是 来 自用 户 的 。 为 了 与 CPU 通信 ， 用 户 不 得 
不 设计 某 种 方法 来 引起 CPU 的 注意 。 因 此 ， 小 型 的 计算 机 系统 采用 中 断 控制 的 IO。 

图 7-8 描述 了 一 个 系统 如 何 实 现 中 断 控制 的 1/O。 现 在 的 情形 与 前 面 讨论 的 例子 一 样 ， 只 不 过 现在 
是 在 外 设 和 CPU 之 间 增 加 了 一 种 通信 方式 。 系 统 中 的 每 个 外 设 都 会 连接 到 一 条 中 断 请 求 线 。 中 断 控制 
芯片 对 于 每 条 中 断 线 都 有 一 个 输入 端 。 只 要 有 中 断 线 的 信号 被 断言 确认 有 效 ， 控 制 器 就 会 对 该 中 断 进 
行 译 码 ， 同 时 激活 CPU 上 的 中 断 Interrupt (INT) 输入 信号 。 当 CPU 已 经 准备 好 处 理 该 中 断 时 ， 
CPU 就 会 发 送 一 个 Interrup Acknowledge (INTA) 信号 。 一 旦 得 到 这 个 确认 信号 ， 中 断 控制 器 就 可 
以 撤销 INT 信号 。 





图 7-8 一 个 使 用 中 断 的 1/O 子 系统 


当然 ， 系 统 设计 者 必须 决定 : 当 有 多 个 设备 同时 请 求 中 断 时 ， 应 该 优先 处 理 哪 一 个 设备 。 通 常 ， 
我 们 会 将 这 个 设计 决定 固化 在 中 断 控制 器 中 。 使 用 相同 操作 系统 和 中 断 控制 器 将 具有 高 优先 权 设备 
(例如 键盘 ) 连接 到 同一 根 中 断 请 求 线 上 。 每 个 系统 所 允许 的 中 断 请 求 线 的 数目 不 相同 ， 而 且 在 某 些 傅 
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况 下 ， 这 种 中 断 是 可 以 共享 的 。 如 果 我 们 非常 清楚 地 知道 在 同一 时 刻 不 会 有 两 个 设备 使 用 同一 个 中 断 
时 ， 共 享 的 中 断 将 不 会 引发 任何 问题 。 例 如 ， 一 个 扫描 仪 和 一 个 打印 机 通常 可 以 使 用 同一 个 中 断 而 和 
平 共 处 。 但 是 ， 对 于 使 用 串 行 接口 连接 的 鼠标 和 modem， 事 情 并 不 总 是 如 此 。 由 于 安装 程序 事先 并 不 
知道 它们 有 可 能 使 用 同一 个 中 断 ， 所 以 中 断 共享 对 这 两 个 设备 都 会 引发 异常 行为 。 图 





计算 机 专家 并 非 对 计算 机 外 的 世界 一 窍 不 通 。 
Bill Walsh 

很 多 人 使 用 information 这 个 词 作为 data 的 同义词 ， 并 且 把 data 作为 byte 的 同义词 。 事 实 上 ， 我 
们 常常 在 文章 中 使 用 data 作为 byte 的 同义词 以 增加 文章 的 可 读 性 ， 希 望 使 得 上 下 文 意思 更 清楚 。 但 
是 ,我 们 必须 指出 这 些 词 在 意义 上 的 确 有 区 别 的 。 

从 字面 上 来 看 ，data 这 个 词 是 复数 的 。 它 来 源 于 单数 形式 的 拉丁 词 datum。 后 来 ， 由 于 要 提 及 多 
个 的 datum， 所 以 人 们 就 适当 地 使 用 data 这 个 词 。 事 实 上 ， 当 有 人 说 : “The recent mortality data 
indicate that people are now living longer than they did a century ago” 这 样 的 话语 时 ， 我 们 会 觉得 很 自 
然 。 但 是 ， 我 们 很 难 解 释 为 什么 我 们 不 会 说 “A page fault occurs when data are swapped from memory 
to disk”。 当 用 data 来 谈论 存储 在 一 个 计算 机 系统 中 的 东西 时 ， 我 们 实际 上 已 经 把 data 概念 化 成 一 个 
“不 可 区 分 的 主体 *， 就 像 我 们 对 空气 和 水 的 感觉 一 样 。 空 气 和 水 出 分 子 的 各 种 分 立 元 素 组 成 。 相 应 地 ， 
由 大 量 的 分 离 元 素 组 成 的 大 量 data 称 为 data。 很 明显 ， 没 有 一 个 受过 教育 ， 英 语 流利 的 人 会 说 “She 
breathes airs ”， 或 者 说 “She takes a bath in waters >”。 因 此 ， 这 样 看 起 来 下 面 的 说 法 也 是 非常 合理 的 ， 
“…data i swapped from memory to disk”。 大 多 数 的 学 术 资 源 (包括 《美国 传统 词典 》) 现在 都 认同 使 
用 在 这 种 方式 时 ， 把 data 作为 一 个 单数 的 集合 名 词 。 

严格 来 说 ， 计 算 机 存储 的 是 介质 而 不 是 存储 data。 计 算 机 存储 的 是 被 称 为 byte 位 组 合 模式 〈 位 
图 )。 例 如 ， 如 果 使 用 二 进 制 的 扇 区 编辑 器 来 检查 磁盘 的 内 容 ， 就 可 能 看 到 010000100 模式 。 所 以 从 结 
果 可 以 得 到 什么 启示 呢 ? 大 家 都 知道 ， 这 种 位 图 可 能 是 程序 的 二 进 制 代码 、 操 作 系统 结 构 的 部 分 内 容 、 
一 张 照片 ， 或 是 某 人 的 银行 账户 的 余额 。 如 果 你 知道 这 些 位 代表 的 是 一 些 数字 量 〈 而 不 是 程序 代码 或 
图 像 文件 )， 并 且 还 知道 它 是 采用 二 进 制 补 码 形式 来 存储 的 。 那 么 你 就 可 以 非常 肯定 地 说 ， 它 代表 的 是 
十 进 制 数 68。 但 是 ， 仍 然 没 有 得 到 一 个 datum。 在 得 到 datum 之 前 ， 人 们 必须 要 把 某 些 上 下 文 与 这 个 
数字 联系 起 来 。 例 如 ， 它 是 一 个 人 的 年 龄 或 体重 ? 是 一 个 铅 头 开启 工具 的 模型 编号 ”如 果 知 道 
01000100 是 来 自 某 个 自动 气象 站 的 一 个 包含 温度 输出 的 文件 的 话 ， 你 就 有 了 自己 的 datum。 磁 盘 上 的 
文件 便 可 以 正确 地 称 为 data 文件 。 

现在 ， 你 可 能 会 猜测 天 气 数据 使 用 华氏 温度 来 表示 ， 因 为 地 球 上 没有 地 方 的 温度 曾经 达到 68' 。 
但 是 你 还 是 没有 得 到 information。 当 前 情况 下 ， 这 个 datum 是 没有 意义 的 : 它 是 荷兰 的 Amsterdam 此 
刻 的 温度 ? 还 是 三 年 前 的 2: 00AM 在 美国 的 Miami 记录 的 温度 ? 只 有 当 它 对 人 们 有 意义 时 ，datum 68 
才 变 成 information 。 

最 近 普 遍 作为 单数 使 用 的 另 一 个 复数 拉丁 名 词 是 media。 以 前 ， 受 过 良好 教育 的 人 ， 只 是 在 想 要 
提 及 一 个 以 上 的 medium 时 才 使 用 media 这 个 词 。 报 纸 是 一 种 类 型 的 通信 medium。 而 电视 是 另外 的 一 
种 medium。 整 体 来 说 ， 它 们 都 是 media。 但 是 现在 的 一 些 编辑 接受 这 样 的 单数 用 法 ，“At this mo- 
ment, the news media is gathering at the Capitol”。 

因为 艺术 家 可 以 使 用 水 彩 画 medium 或 者 油画 medium 来 作画 ， 计 算 机 的 数据 记录 设备 可 以 将 信息 
写 到 某 个 电子 medium 中 ， 例 如 磁带 或 磁盘 。 整 体 来 说 ， 它 们 都 是 电子 media。 但 是 我 们 却 很 少 看 到 一 
个 计算 机 的 从 业者 会 有 意识 地 正确 使 用 这 个 术语 。 更 多 的 情况 下 ， 我 们 遇 到 的 是 类 似 于 下 面 的 这 类 陈 
述 ,“Volume 2 ejected. Please place new media into the tape drive”。 在 这 里 ， 大 多 数 人 是 否 能 够 理解 下 
面 的 这 个 指令 还 是 值得 争论 的 事情 ,“…place a new medium into the tape drive”。 

当 计 算 机 专家 力图 采用 数字 形式 来 表达 人 类 思想 时 (反之 亦 然 )， 他 们 会 遇 到 这 样 的 语义 争论 。 在 
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该 类 型 的 转换 过 程 中 肯定 会 丢失 信息 ， 并 且 我 们 要 学 会 去 接受 这 样 的 事情 。 但是， 有 些 事 情 可 能 会 超 
出 我 们 愿意 接受 的 极限 。 这 些 限 度 有 时 被 称 为 人 的 “本 性 ”。 


7.4 磁盘 技术 


在 磁盘 驱动 器 技术 出 现 之 前 ， 顺 序 存储 介质 ， 如 打 孔 卡片 、 磁 带 和 纸 带 ， 是 唯一 可 用 的 持久 性 的 
存储 介质 。 如 果 某 个 用 户 所 需 的 数据 写 在 磁带 卷轴 的 尾部 ， 则 需要 读 取 整 卷 才能 读 取 ， 并 且 每 次 都 只 
能 阅读 一 个 记录 。 迟 缓 的 读 取 设 备 和 小 的 系统 内 存 常常 使 数据 的 读 取 过 程 极其 缓慢 。 纸 带 、 磁 带 和 卡 
片 不 仅 处 理 速度 很 惕 ， 而 且 由 于 它们 所 暴露 的 物理 环境 的 影响 ， 其 性 能 也 会 很 快 衰减 。 纸 带 使 用 时 总 
是 绷 紧 容 易 断 裂 。 开 放 的 卷轴 磁带 不 仅 会 绷 紧 ， 而 且 容 易 被 操作 人 员 误 处 理 。 卡 片 可 能 会 被 据 碎 、 丢 
失 和 弯曲 折 坏 。 

在 存储 技术 的 发 展 过 程 中 ， 读 者 不 难看 出 ，1956 年 [BM 公司 所 发 布 的 第 一 台 商 用 磁盘 计算 机 是 如 
何 彻底 地 改变 了 计算 机 的 世界 。 这 人 台 机 器 被 称 为 使 用 随机 访问 方法 的 会 计 和 控制 计算 机 ， 或 者 简称 
RAMAC (Random Access Method of Accounting and Control Compnuter) 。 按 照 今天 的 标准 ， 早 期 计算 
机 使 用 的 磁盘 体积 巨大 并 且 速 度 缓慢 ， 是 我 们 所 难以 理解 的 。 当 时 ， 每 个 磁盘 的 直径 尺寸 为 24 英寸 ， 
但 是 磁盘 的 每 一 面 却 仅 能 容纳 50 000 个 7- 位 的 字符 。 可 以 想像 ，50 个 双 面 的 磁盘 安装 在 一 根 转轴 上 ， 
并 用 一 个 闪耀 玻璃 罩 包 围 起 来 ， 大 小 与 一 个 花园 的 杂 屋 差不多 。 每 个 转轴 上 磁盘 的 总 存储 容量 约 为 
500 万 字符 ， 每 次 访问 磁盘 上 的 数据 ， 平 均 需 要 整整 一 秒 的 时 间 。 这 种 磁盘 驱动 器 的 总 重量 超过 1 吨 ， 
并 且 制 造成 本 需要 几 百 万 美元 。 当 时 ， 没有 人 可 能 会 从 IBM 购买 这 些 设备 。 

相 比 之 下 ， 到 了 2000 年 初 ，IBM 公司 开始 推销 一 种 用 于 掌上 电脑 和 数码 相机 的 高 容量 磁盘 驱动 
器 。 这 些 磁 盘 的 直径 尺寸 仅 为 1 英寸 ,并且 能 保存 1GB 字 节 的 数据 ， 而 数据 的 平均 访问 时 间 只 有 15 
毫秒 。 这 种 磁盘 驱动 器 的 重量 不 足 1 次 司 ， 而 零售 价格 低 于 300 美元 。 

磁盘 驱动 器 被 称 为 随机 (random) 存储 设备 ， 有 时 也 称 为 直接 (direct) 存储 设备 。 磁 盘 上 的 每 个 存 
储 单元 ， 称 为 扇 区 《sector) ， 都 有 一 个 独一无二 的 存 取 地 址 ， 可 以 与 周围 的 扇 区 区 别 。 如 图 7-9 所 示 ， 
这 些 扇 区 按照 同心 圆 环 的 形式 划分 成 一 圈 一 圈 的 磁道 (track)。 对 于 大 多 数 的 磁盘 系统 ， 每 一 个 磁道 包含 
的 扇 区 数 相同 ， 而 且 每 一 个 扇 区 都 包含 相同 数目 的 字 
节 。 因 此 不 难看 出 ， 数 据 在 磁盘 中 心 部 分 写 人 的 数据 
比 外 部 边缘 部 分 要 更 加 密集 。 某 些 制造 厂商 会 将 全 部 
扇 区 都 制作 成 近似 相同 的 容量 ， 而 在 外 部 的 磁道 上 放 
置 比 内 部 磁道 更 多 的 扇 区 ， 这 样 可 以 在 磁盘 上 存储 更 
多 的 信息 。 这 种 方式 称 为 分 区 位 〈zoned-bit) 记录 
法 。 现 在 很 少 使 用 这 种 记录 法 。 因 为 与 传统 磁盘 系统 
相 比 ， 它 需要 更 加 复杂 的 驱动 控制 电路 。 

磁道 是 从 磁盘 最 外 边 的 磁道 0 开始 连续 编号 。 
然而 ， 在 一 条 磁道 分 布 的 圆周 上 ， 扇 区 的 分 配 顺 序 
可 能 是 不 连续 的 。 它 们 有 时 “ 跳 来 跳 去 (skip 
around)”， 这 样 允 许 驱 动 器 电路 有 时 间 在 读 取 下 一 
个 扇 区 之 前 处 理 完 扇 区 进程 的 内 容 。 这 种 方法 称 为 
交叉 存储 技术 。 根 据 磁 盘 的 旋转 速度 和 磁盘 电路 速 
度 以 及 缓冲 区 的 大 小 不 同 ， 这 种 交叉 存储 技术 会 有 
所 变化 。 当 今 大 多 数 的 硬盘 驱动 器 读 取 磁盘 采用 一 (ECC ) 

次 读 取 一 条 磁道 的 方式 ， 而 不 是 一 次 读 取 一 个 扇 区 图 7-9 磁盘 扇 区 : 其 中 画 出 了 扇 区 间隙 和 
的 方式 ， 现 在 所 有 交叉 存储 技术 已 经 不 是 很 流行 了 。 逻辑 扇 区 的 格式 
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7.4. 1 硬盘 驱动 器 
硬盘 (hard 或 fixed) 包括 控制 电路 和 一 个 或 多 个 金属 或 玻璃 盘 片 。 这 些 称 为 碟 片 (platter) 的 盘 


片上 镀 有 一 层 薄 的 磁性 材料 薄膜 ,磁盘 碟 片 堆 驱动 辟 
午 在 转轴 上 ， 通 过 传动 箱 中 的 一 个 马达 来 带动 磁 ER 

盘 碟 片 旋转 。 磁 盘 的 旋转 速度 可 以 达到 每 分 钟 
15 000 转 〈rpm)， 典 型 的 磁盘 转速 为 5400 rpm 
和 7200 rpm。 磁 盘 的 读 / 写 头 通常 安装 在 一 个 旋 
转 的 磁盘 驱动 辟 (actuator arm) 上 ， 磁 盘 驱 动 
臂 通过 其 转轴 上 缠绕 的 线圈 的 感应 磁场 来 进行 准 
确 的 定位 〈 参 见 图 7-10) 。 录 果 给 驱动 璧 提供 传 
动能 量 ， 则 整个 梳 状 的 读 写 头 就 可 以 向 磁盘 的 中 
心 移动 ， 或 者 是 从 磁盘 的 中 心 移 开 。 

尽管 磁盘 技术 得 到 了 持续 的 发 展 ， 但 是 我 们 
现在 还 不 能 大 批量 生产 完全 不 出 错 的 介质 。 尽 管 
出 错 的 概率 非常 小 ,但 是 出 错 总 是 难免 的 。 目 
前 ， 我 们 采用 两 个 机 制 来 减少 磁盘 表面 可 能 出 现 的 错误 : 对 数据 本 身 进行 特殊 的 编码 和 使 用 纠 错 算 法 。 
这 种 特殊 的 编码 方式 和 某 些 纠 错 的 校 验 编码 方法 在 第 2 章 中 已 经 讨论 。 这 些 工 作 将 由 磁盘 控制 器 硬件 
中 的 特殊 电路 来 处 理 。 而 磁盘 控制 器 中 的 其 他 电路 负责 磁头 的 定位 和 磁盘 的 定时 同步 任务 。 

对 于 一 个 堆 全 的 磁盘 结构 ， 磁 盘 上 的 各 个 磁道 上 下 一 一 对 应 ， 形 成 一 个 圆柱 面 。 一 组 梳 状 的 读 写 
头 每 次 可 以 访问 一 个 柱 面 。 柱 面 描述 的 是 每 个 磁盘 上 的 环 状 区 域 。 

通常 ， 磁 盘 的 可 用 面 上 都 有 一 个 磁头 。 而 对 于 一 些 老式 的 磁盘 系统 ， 特 别 是 某 些 移动 磁盘 ， 最 上 
层 碟 片 的 上 表面 和 最 下 层 碟 片 的 下 表面 常常 都 是 不 用 的 。 硬 盘 磁 头 从 来 都 不 会 触及 磁盘 的 表面 ， 而 是 
悬浮 在 磁盘 表面 的 上 方 ， 它 们 之 间 仅 仅 相 隔 有 几 个 微米 厚 的 空气 层 。 当 磁盘 系统 断 电 后 ， 磁 头 退 到 一 
个 安全 的 地 方 。 这 一 过 程 称 之 为 停靠 磁头 〈parking the heads) 。 如 果 读 写 头 接触 到 磁盘 的 表面 ， 将 损 
坏 磁盘 。 这 种 情况 称 为 磁头 撞 损 (head crash) 。 

磁头 撞 损 是 早期 的 磁盘 驱动 器 很 常见 的 现象 。 在 第 一 代 磁 盘 系 统 中 ， 驱 动 器 的 机 械 部 件 和 电子 
组 件 的 价格 与 磁盘 碟 片 相 比 ， 都 是 非常 昂贵 的 。 为 了 用 最 少 的 资金 提供 最 多 的 存储 器 系统 ， 计 算 机 
制造 商 使 用 了 一 种 称 为 磁盘 组 (disk pack) 的 可 移动 磁盘 来 制造 硬盘 驱动 器 。 然 而 ， 如 果 打 开 驱 动 
器 密封 外 壳 ， 各 种 空气 污染 杂质 物 ， 如 灰尘 和 水 汽 ， 都 会 进入 到 磁盘 系统 中 。 结 果 ， 在 磁头 到 磁盘 
之 间 需 要 保持 一 个 大 的 间隙 来 防止 杂质 导致 磁头 的 撞 损 。 尽 管 在 磁头 到 磁盘 之 间 留 有 较 大 的 间隙 ， 
但 是 磁头 撞 损 事件 仍然 会 持续 发 生 ， 以 至 于 某 些 公司 由 此 所 经 历 的 停工 时 间 几 乎 与 生产 时 间 一 样 长 。 
当然 ， 加 大 磁头 到 磁盘 之 间 的 空隙 ， 实 际 上 是 降低 了 数据 的 存储 密度 。 磁 头 到 磁盘 的 距离 越 大 ， 需 
要 更 强 的 磁 荷 来 感应 读 取 数 据 所 需 的 磁盘 表面 涂 敷 层 中 的 磁 通 量变 化 。 要 得 到 更 强 的 磁 荷 ， 就 需要 
有 更 多 的 磁 介 质粒 子 (会 占据 更 大 的 磁 表 面 ) 来 参与 磁 通 量 的 转变 过 程 ， 这 样 就 会 降低 磁盘 驱动 器 
上 的 数据 密度 。 

后 来 ， 由 于 控制 器 电路 和 机 械 组 件 的 成 本 大 幅度 下 降 ， 使 得 密封 式 磁盘 系统 得 到 了 广泛 的 应 用 。 
IBM 公司 最 先 发 明 了 这 种 技术 ， 当 时 这 种 技术 开发 使 用 的 是 “ 温 彻 斯 特 (Winchester)” 编 码 。 因 此 ， 
温 彻 斯 特 很 快 变 成 了 密封 式 磁盘 的 代名词 。 今天， 没有 人 再 生产 可 移动 磁盘 组 的 驱动 器 ， 所 以 我 们 也 
没有 必要 对 磁盘 进行 细致 的 区 分 。 密 封 式 驱动 器 允许 磁头 到 磁盘 的 间隙 靠 得 更 近 ， 因 而 增加 了 数据 的 
存储 密度 以 及 提高 磁盘 的 旋转 速度 。 这 些 要 素 构 成 了 硬盘 驱动 器 的 性 能 特征 。 

寻 道 时 间 (seek time) 是 指 磁盘 驱动 臂 定位 到 指定 的 磁道 上 所 需 的 时 间 。 寻 道 时 间 并 不 包括 磁头 
读 取 磁 盘 目录 (disk directory) 的 时 间 。 磁 盘 目 录 将 逻辑 文件 信息 ， 例 如 ，my stozry. doc， 了 映射 到 





六 
图 7-10 硬盘 驱动 臂 〈 连 同 读 / 写 头 ) 和 磁盘 
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对 应 的 物理 扇 区 地 址 ， 例 如 第 7 柱 面 中 第 3 表面 的 第 72 扇 区 (简写 为 柱 面 7， 表 面 3， 肩 面 72) 。 一 些 
高 性 能 磁盘 驱动 器 ， 会 在 磁盘 的 每 个 可 用 面 的 每 个 磁道 上 都 提供 一 个 读 写 头 ， 这 样 实 际 上 可 以 消除 寻 
道 时 间 。 由 于 这 种 系统 中 没有 可 移动 的 驱动 臂 ， 所 以 访问 数据 时 唯一 可 能 延迟 的 是 磁盘 的 旋转 延迟 。 

旋转 延迟 (rotational delay) 是 读 写 头 定 位 到 指定 的 扇 区 上 方 所 需要 的 时 间 。 旋 转 延 迟 时 间 与 寻 道 
时 间 的 和 称 为 存 取 时 间 。 如 果 将 存 取 时 间 与 从 磁盘 上 实际 读 取 数 据 所 需要 的 时 间 相 加 ， 就 得 到 了 传输 
时 间 (tranfer time) 。 当 然 ， 传 输 时 间 的 多 少 取决 于 所 要 读 取 的 数据 量 的 多 少 。 反 应 时 间 (latency) 是 
旋转 速度 的 直接 函数 。 反 应 时 间 用 来 衡量 在 驱动 臂 定 位 到 目标 磁道 后 ， 目 标 扇 区 移动 到 读 / 写 头 的 下 方 
位 置 所 需要 的 时 间 总 量 。 通 常 引 用 平均 数 表示 ， 计 算 公 式 如 下 : 


60 秒 1000ms 
(十 莹 巷 转 速度 X 称号 )/2 


为 了 对 上 面 这 些 术语 有 一 个 全 面 的 了 解 ， 图 7-11 给 出 了 一 个 典型 的 磁盘 的 说 明 书 。 
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300 000 小 时 
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92.2Kbpi 
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12.5mm 
100mm 
70mm 
170g 


SC~55C 

40C ~71C 

5% ~ 95% 
33dBA, 空 闪 状态 


开启 / 停止 循环 次 数 

设计 寿命 

数据 差错 率 
(不 可 修复 ) 


基本 性 能 : 
寻 道 时 间 
平均 
平均 反应 时 间 
转速 
(+/—0.20%) 
控制 器 开销 
数据 传输 率 ; 
往 / 返 介质 
往 / 返 主机 
启动 时 间 





50 000 
5 年 (最 少 ) 


<1 每 读 10? 位 


4.5 ms 
14 ms 
6.72 ms 


4464 rpm 
<200 上 秒 


6.0 MB/ 秒 
11.1 MB/ 秒 


5 秒 


， ”图 7-11 磁盘 驱动 器 制造 商 提供 的 一 个 典型 的 硬盘 说 明 书 
因为 在 每 次 执行 读 写 操作 之 前 都 必须 先 读 取 磁盘 目录 ， 所 以 磁盘 目录 的 存放 位 置 对 磁盘 驱动 器 的 
整体 性 能 有 重大 的 影响 。 由 于 磁盘 最 外 层 的 磁道 在 相同 的 面积 内 具有 最 低 的 位 密度 ， 因 此 与 内 层 的 磁 
道 相 比 ， 这 些 区 域 最 不 容易 出 现 位 错误 。 为 了 保证 最 高 的 可 靠 性 ， 磁 盘 目录 可 以 存放 在 最 外 层 的 磁道 ， 
也 就 是 磁道 0。 这 就 意味 着 ， 每 次 存 取 操作 时 ， 驱 动 臂 都 必须 向 外 摆动 到 磁道 0， 然 后 再 回 到 所 需 数据 
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的 磁道 上 。 因 此 ， 存 取 驱 动 辟 大 跨度 的 移动 可 能 在 很 大 程度 上 影响 磁盘 系统 的 性 能 。 

随 着 记录 技术 和 纠 错 算法 的 发 展 ， 现 在 已 经 允许 将 磁盘 目录 放 到 能 够 提供 最 佳 性 能 的 位 置 上 : 即 
放 在 最 中 间 的 磁道 上 。 这 种 方法 可 以 充分 地 减少 驱动 臂 移动 距离 ， 提 供 最 大 可 能 的 吞吐 量 。 肉 此。 有 
一 些 〈 但 不 是 全 部 ) 现代 磁盘 系统 采用 在 中 央 磁 道 存 放 和 磁盘 目录 。 

目录 存放 是 磁盘 逻辑 组 织 的 一 个 要 素 。 磁 盘 的 逻辑 组 织 与 磁盘 的 操作 系统 密切 相关 。 磁 盘 逻 辑 组 
织 的 一 个 主要 方面 是 扇 区 和 逻辑 地 址 之 间 的 映射 关系 。 由 于 硬盘 包括 很 多 的 扇 区 ， 不 可 能 为 每 个 肩 区 
都 保存 一 个 标记 。 下 面 ， 我 们 考虑 在 图 7-11 的 数据 表 中 所 描述 的 磁盘 。 磁 盘 系 统 有 5 个 表面 ， 每 个 表 
面 有 3196 条 磁道 。 而 每 个 磁道 包含 有 132 个 户 区 。 这 就 意味 着 ， 在 磁盘 系统 中 共有 2 109 360 个 扇 区 。 
如 果 用 一 个 分 配 表 来 列 出 每 个 扇 区 的 状态 ， 用 1 字 节 来 记录 每 个 状态 ， 那 么 将 会 因此 要 消耗 2MB 字 节 
的 磁盘 空间 。 这 种 做 法 不 仅 要 花费 大 量 的 磁盘 空间 开销 ， 而 且 在 需要 检查 某 个 扇 区 的 状态 时 ， 读 取 数 
据 结构 无 疑 也 会 或 多 或 少 地 消耗 一 定 的 时 间 量 。 显 然 ， 检 查 扇 区 的 状态 是 一 个 需要 频繁 执行 的 任务 。 
正 是 因为 这 个 原因 ， 操 作 系统 以 群 组 的 形式 为 扇 区 分 配 地 址 ， 称 为 区 块 (block， 或 cluster) 。 采 用 这 
种 地 址 分 配方 式 ， 可 以 使 文件 管理 变 得 更 加 简单 。 每 个 块 中 扇 区 的 数目 决定 了 分 配 表 的 大 小 。 如 果 分 
配 的 块 越 小 ， 则 当 一 个 文件 不 能 装 满 整个 块 时 ， 被 浪费 的 磁盘 空间 也 就 越 少 。 但 是 ， 如 果 磁 盘 块 分 配 
得 太 小 ， 记 录 块 的 分 配 表 就 会 变 得 很 大 ， 而 且 查 找 的 速度 也 会 变 得 很 慢 。 下 一 节 介 绍 软 盘 系 统 时 ， 我 
们 将 会 深入 讨论 目录 和 文件 分 配 结构 之 间 的 相互 关系 。 

图 7-11 中 有 关 磁 盘 规 格 说 明 的 最 后 要 讨论 的 一 点 是 : 标题 “可 靠 性 和 维护 ”下 面 的 有 关 对 磁盘 可 
靠 性 的 各 种 估计 。 根 据 制 造 厂商 的 说 法 ， 这 种 特殊 设计 的 磁盘 驱动 器 使 用 期 限 为 5 年 ,并且 可 以 允许 
系统 启 停 50 000 次 。 同 样 ， 在 这 个 标题 下 ， 系 统 的 平均 失效 时 间 (Mean Time to Failure，MTTF) 是 
300 000 小 时 。 可 以 肯定 ， 该 数字 并 不 能 表示 这 种 磁盘 驱动 器 的 寿命 的 期 望 值 是 300 000 小 时 。 如 果 磁 
盘 持续 运行 ， 该 数字 表示 将 会 超过 34 年 。 

这 个 规格 说 明 书 很 清楚 地 表明 了 这 种 磁盘 驱动 器 的 设计 寿命 仅 可 以 持续 5 年 。 这 种 明显 的 差异 是 
由 于 采用 了 制造 业界 通行 的 统计 质量 管理 方法 所 造成 的 。 除 非 这 种 磁盘 是 根据 政府 的 合同 制造 的 ， 否 
则 用 来 计算 MTTF 的 确切 方法 完全 是 由 制造 厂商 来 决定 的 。 通 常 ， 这 个 计算 过 程 包括 ， 从 生产 线 上 随 
机 取样 ， 并 在 一 些 不 太 理 想 的 条 件 环境 中 运行 磁盘 系统 某 个 定量 的 时 间 ， 通 常 大 于 100 个 小 时 。 然 后 
将 失效 数目 描绘 成 概率 曲线 ， 最 后 得 到 MTTF 的 数字 。 简 言 之 ， 规 格 说 明 中 有 关 “ 设 计 寿 命 ” 的 数据 
更 让 人 可 信和 容易 理解 。 


7.4.2 软盘 


软盘 (Floppy Disk) 的 组 织 方 式 与 硬盘 非常 相似 ， 也 是 按照 磁道 和 户 区 来 寻 址 的 。 它 们 通常 之 所 
以 被 称 为 软盘 ， 是 因为 磁盘 的 磁性 材料 涂 层 是 附着 在 一 个 软 性 的 聚 脂 塑 料 (Mylar) 基 片 上 。 事 实 上 ， 
由 于 软盘 不 能 采用 像 硬 盘 同 样 的 方式 密封 起 来 ， 所 以 软盘 的 数据 密度 和 旋转 速度 〈 一 般 为 300 或 360 
RPM) 受到 了 很 大 的 限制 。 另 外 ， 软 盘 的 读 写 头 还 必须 接触 到 磁盘 的 磁 表 面 。 当 读 写 头 上 有 帖 粒 时 ， 
读 写 头 的 磨擦 会 引起 磁性 涂 层 的 磨损 。 因 此 ， 必 须 定期 清洗 磁头 ， 以 清除 可 能 导致 软盘 磨损 的 微粒 。 

如 果 仔 细 检 查 3. 5 "软盘 ， 可 以 看 到 软盘 中 心 的 金属 轴 上 有 一 个 矩形 孔 。 软 盘 驱 动 器 的 机 电 装置 就 
是 利用 这 个 孔 来 确定 第 一 个 扇 区 的 位 置 ， 第 一 个 扇 区 位 于 软盘 的 最 外 部 的 边缘 。 

与 硬盘 相 比 ， 软 盘 的 组 织 结构 和 操作 规范 更 加 统一 。 例 如 ， 考 虑 3. 5”1. 44MB DOS/Windows 软 
盘 。 软 盘 的 每 个 扇 区 包括 512 个 数据 字 节 。 每 条 磁道 上 有 18 个 扇 区 ， 且 软盘 的 每 一 面 有 80 条 磁道 。 
扇 区 0 是 软盘 的 引导 扇 区 〈boot sector)。 如 果 这 个 软盘 是 引导 盘 〈 也 称 为 启动 盘 ) ， 那 么 这 个 引导 肩 区 
就 包含 能 让 系统 从 软盘 而 不 是 硬盘 启动 的 信息 。 

紧 接着 引导 肩 区 的 是 两 个 完全 相同 的 文件 分 配 表 (File Allocation Table，FAT) 的 副本 。 标 准 的 
1. 44MB 软盘 的 每 个 FAT 的 大 小 是 9 个 肩 区 长 。 在 1. 44MB 软盘 中 ， 一 个 区 块 (cluster)， 即 一 个 可 编 
址 的 单元 ， 是 由 一 个 扇 区 组 成 的 。 因 此 ， 对 于 磁盘 上 的 每 一 个 数据 扇 区 ， 在 FAT 上 都 有 一 个 条 目 。 
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磁盘 的 根 目录 占 用 了 从 扇 区 19 开始 的 14 个 扇 区 。 每 个 根 目录 的 条 目 占 用 32 字 节 。 每 个 根 目录 存 
储 文件 名 、 文 件 属性 存档、 隐藏 、 系 统 ， 等 等 )、 文 件 的 时 间 表 、 文 件 大 小 和 文件 存放 的 起 始 区 块 
( 扇 区 ) 的 编号 。 起 始 的 区 块 编号 指向 FAT 中 的 某 个 条 目 。 并 且 ， 如 果 某 个 数据 文件 占用 多 个 区 块 的 
话 ， 它 还 允许 我 们 去 跟踪 这 个 数据 文件 所 跨越 的 扇 区 链 。 

FAT 是 一 个 简单 的 表 结 构 ， 它 采用 位 图 形式 来 记录 磁盘 上 每 一 个 区 块 的 基本 信息 ， 指 示 区 块 是 否 
处 于 空闲 、 保 留 、 数 据 占用 、 或 者 坏 区 的 状态 。 因 为 一 个 1. 44MB 磁盘 包含 18X80X2 一 2880 个 扇 区 ， 
所 以 每 个 FAT 条 目 需要 12 位 ， 仅 用 来 指出 一 个 区 块 。 实 际 上 ， 软 盘 上 的 每 一 个 FAT 条 目 都 是 16 位 
宽 的 ， 所 以 这 种 组 织 方法 称 为 FAT16。 如 果 一 个 磁盘 文件 跨越 多 个 区 块 ， 那 么 该 文件 的 第 一 个 FAT 
条 目 中 同样 包含 一 个 转向 该 文件 下 一 个 FAT 条 目的 指针 。 如 果 一 个 FAT 条 目 是 文件 的 最 后 一 个 肩 区 ， 
则 “下 一 个 FAT 条 目 ” 的 指针 中 包括 文件 结束 的 标记 。FAT 的 链表 结构 允许 文件 存储 于 磁盘 中 的 任 
意 空 闲 扇 区 ， 而 不 管 这 些 扇 区 的 位 置 是 否 连续 。 

为 了 理解 清楚 这 种 概念 ， 下 面 我 们 考虑 图 7-12 所 给 出 的 FAT 条 目 。 如 上 所 述 ， 磁 盘 上 的 每 个 区 
块 在 FAT 中 都 包含 一 个 条 目 。 假 设 文件 占用 了 从 扇 区 121 开始 的 4 个 扇 区 。 当 读 取 该 文件 时 ， 会 发 生 
如 下 操作 过 程 。 
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FAT 内 容 


图 7-12 一 个 文件 的 分 配 表 


1. 读 取 磁盘 目录 查找 文件 起 始 区 块 〈121) 。 读 取 第 一 个 区 块 去 取 回 文件 的 第 一 部 分 。 

2. 读 取 位 于 区 块 121 的 FAT 条 目 查找 文件 的 剩余 部 分 ， 这 里 给 出 了 文件 的 下 一 个 数据 区 块 和 相 
应 的 RAT 条 目 (124)。 

3, 读 取 区 块 124 和 相应 的 FEAT 条 目 ，FAT 条 目 指出 下 一 个 数据 在 扇 区 126。 

4 读 取 数据 扇 区 126 和 相应 的 FAT 条目 ，FAT 条 目 指出 下 一 个 数据 在 扇 区 在 122。 

5. 读 取 数据 扇 区 122 和 相应 的 FEAT 条目， 直到 在 下 一 个 扇 区 位 置 找到 二 EOF 之 标记 ， 这 时 系统 
知道 已 经 得 到 了 文件 的 最 后 一 个 扇 区 。 

我 们 很 容易 就 可 以 发 现在 FAT 磁盘 的 组 织 结构 中 还 有 很 多 性 能 改进 的 空间 。 这 就 是 为 什么 FAT 
不 被 用 在 高 性 能 的 、 大 规模 的 系统 上 的 原因 。 但 是 ，FAT 对 软盘 仍然 很 有 用 ， 这 其 中 有 两 个 原因 。 第 
一 ， 对 于 软盘 来 说 ， 性 能 不 是 考虑 的 重要 因素 。 第 二 ， 软 盘 有 标准 的 容量 ， 而 不 像 硬盘 那样 容量 几乎 
每 天 都 在 增加 。 因 此 ,简单 的 FAT 结构 不 可 能 产生 当 磁 盘 容量 开始 超过 32MB 时 FAT16 结构 通常 所 
遇 到 的 问题 。 如 果 使 用 16 位 的 区 块 指针 ， 则 一 个 33MB 磁盘 的 一 个 区 块 的 大 小 至 少 必须 有 1KB。 当 磁 
盘 驱 动 器 的 容量 继续 增加 时 ，FAT16 的 扇 区 会 变 得 更 大 。 这 时 ， 如 果 一 些小 文件 不 能 占 满 整个 区 块 
时 ,会 浪费 很 多 的 磁盘 空间 。 而 对 于 大 于 2GB 的 磁盘 系统 ， 则 要 求 的 区 块 大 小 达到 64KB。 

不 同 的 厂商 使 用 了 许多 自己 的 技术 方案 来 提高 软盘 上 的 数据 密度 。 这 些 技术 中 最 流行 的 是 Zip 驱 
动 器 ,， 它 是 由 I6mega 公司 首先 开发 出 来 的 。 这 种 技术 使 用 的 是 磁 - 光 设计 ， 它 结合 了 磁盘 存储 器 的 可 
重复 读 写 和 激光 技术 所 提供 的 读 / 写 头 精确 定位 的 优点 。 然 而 ， 为 了 发 展 高 容量 的 长 期 数据 存储 器 ， 随 
着 价格 便宜 的 光学 存储 方法 的 出 现 ， 软 盘 系统 很 快 就 变 得 过 时 了 。 
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现在 ， 光 学 存储 器 系统 实际 上 可 以 提供 无 限制 的 存储 容量 ， 而 价格 上 又 可 以 与 磁带 竞争 。 光 盘 具 
有 多 种 格式 ， 最 流行 的 是 大 家 普遍 使 用 的 CD-ROM (compact disk-read only memory)。CD-ROM 能 够 
保存 超过 0. 5GB 的 数据 。CD-ROM 是 一 种 只 读 存储 介质 ， 用 来 发 布 软件 和 数据 非常 理想 。CD-R (CD- 
recordable) 、CDRW (CD-rewritable) 和 WORM (write onice read many) 光盘 也 都 是 光学 存储 设备 ， 
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通常 用 作 长 期 数据 的 存档 和 大 量 数据 的 输出 。CD-R 和 WORM 光盘 为 文档 和 数据 提供 了 大 容量 的 防 算 
改 存储 器 。 为 了 数据 的 长 期 归档 存储 ， 一 些 计算 机 系统 会 直接 将 数据 输出 到 光学 存储 器 ， 而 不 是 打印 
纸 或 微缩 胶片 上 。 这 种 光盘 称 为 计算 机 输出 激光 盘 (Computer Output Laser Disk，COLD) 。 带 有 机 械 
手 的 自动 存储 库 系统 又 称 为 自动 光盘 柜 (optical jukeboxes)， 可 以 直接 访问 大 量 的 光盘 。 自 动 光盘 柜 
机 可 以 存储 大 量 的 数据 达到 几 百 张 光盘 ， 总 容量 可 达 50GB 到 1200GB,， 或 者 更 多 。 光 盘存 储 器 的 支持 
者 声称 光学 存储 器 ， 不 同 于 磁 介 质 ， 能 够 储存 100 年 而 不 会 有 明显 的 性 能 衰退 。 现 在 ， 又 有 其 他 什么 
存储 器 可 能 来 挑战 这 种 说 法 呢 ? 


7.5.1 CD-ROM 


CD-ROM 是 一 种 利用 聚 碳酸 酯 材料 (塑料) 制造 的 光盘 。 光 盘 的 直径 大 小 为 120 毫米 〈4.8 英 
二)， 并 且 涂 表 一 层 铝 反射 膜 。 铝 膜 的 上 面 使 用 一 层 丙烯 酸 材料 的 保护 性 密封 涂 层 ， 以 防止 铝 膜 的 磨损 
和 腐蚀 。 光 盘 上 的 铝 层 会 反射 来 自 光 盘 下 面 的 绿色 激光 二 极 管 所 发 射 的 光束 。 反 射 光 束 通过 一 个 棱镜 ， 
将 光线 偏转 到 一 个 光电 检测 器 上 。 光 电 检 测 器 就 会 把 光学 脉冲 转换 成 电信 号 ， 然 后 发 送 给 驱动 器 的 电 
学 译 码 装置 ， 如 图 7-13 所 示 。 





图 7-13 CD-ROM 驱动 器 的 内 部 结构 

光盘 的 数据 写 和 使 用 的 是 从 中 心 到 外 部 边缘 的 方式 ， 在 聚 碳酸 酯 基 片 上 形成 一 条 凹凸 不 平 的 单一 
螺旋 状 的 轨道 〈 光 轨 )。 四 陷 的 区 域 称 为 钙 坑 (pit)， 因 为 从 CD 的 上 表面 来 看 他 们 的 确 很 像 止 坑 。 在 
止 坑 之 间 的 平 直 空间 称 为 平台 (land) 。 止 坑 的 尺寸 为 0. 5 微米 宽 ，0. 83 一 3. 56 微米 长 。 止 坑 的 边缘 位 
置 对 应 于 二 进 制 数 1。 从 四 坑 底 部 到 凸 起 平台 的 高 度 为 绿色 激光 二 极 管 所 产生 激光 波长 的 四 分 之 一 。 
这 意味 着 由 于 光 的 干涉 效应 会 导致 从 四 坑 反 射出 来 的 激光 束 与 来 自 激 光 器 的 入射 光 严 格 相 消 。 这 就 导 
致 了 光 脉 冲 的 亮 和 暗 ， 而 被 驱动 器 电路 解释 为 二 进 制 数字 。 

相 邻 圆圈 的 螺旋 光 轨 的 距离 ， 称 为 轨道 间距 〈track pitch)， 距 离 必须 大 于 1.6 微米 (参见 图 7-14) 。 





时 1].6pkm 
7-14 CD 的 螺旋 光 轨 和 轨道 的 放大 图 


204 第 7 章 





如 果 拆 开 一 个 CD-ROM 或 者 音乐 CD， 并 把 数据 光 轨 平 铺 在 地 面 上 ， 那 么 由 凹 坑 和 平台 组 成 的 数据 线 
将 可 以 延伸 到 几乎 5 英里 (8 千 米 ) 长 。 但是， 它们 的 宽度 却 只 有 0. 5 微米 宽 ， 还 不 到 人 的 头发 丝 粗 细 
的 一 半 ， 用 肉眼 几乎 看 不 到 。 

尽管 一 个 CD 仅 有 一 条 光 轨 ， 但 是 在 大 多 数据 光盘 文献 中 都 将 由 四 境 和 平台 线 旋转 360 构成 的 一 个 
圆圈 视 为 一 个 光 轨 。 与 磁盘 存储 器 不 同 的 是 ， 光 盘 中 心 的 轨道 和 光盘 外 圈 的 轨道 都 有 着 相同 的 位 密度 。 

CD-ROM 最 初 设计 用 来 存储 音乐 和 其 他 顺序 音频 信号 的 。 它 在 数据 存储 方面 的 应 用 是 人 们 后 来 的 
想法 ， 图 7-15 给 出 了 光盘 的 数据 扇 区 的 格式 。 可 以 看 到 ， 光 盘 上 的 数据 存储 在 扇 区 的 信息 块 中 ， 信 息 
块 由 扇 区 的 2352 字 节 组 成 ， 这 些 扇 区 沿 着 规 道 长 度 的 方向 排列 。 扇 区 由 98 个 588 位 的 基本 单元 组 成 ， 
这 些 基 本 单元 被 称 为 信道 帧 (channel frame) 。 信 道 帧 由 同步 信息 、 文 件 头 和 有 效 载荷 的 33 个 17 位 的 
符号 组 成 ， 如 图 7-16 所 示 。 其 中 ，17 位 符号 采用 的 是 一 个 RLL(2,10) 编 码 方式 ， 称 为 EFM (8 到 14 
的 调制 编码 ) 。 光 盘 驱动 器 读 取 和 和 解释 ( 称 为 解 调 ，demodulate) 信道 帧 ， 并 创建 另外 一 种 被 称 为 小 帧 
(small frame) 的 数据 结构 。 一 个 小 帧 有 33 字 节 宽 。 其 中 ， 用 户 数据 占用 32 字 节 ， 剩 下 的 一 个 字 节 用 
来 作为 子 信 道 (subchannel) 信息 。 这 里 ， 有 8 个 子 信道 ， 分 别 命名 为 P、_Q、R、S、T、U、V 和 W。 
除了 子 信道 P 和 Q 外 ， 所 有 的 子 信道 只 对 音频 应 用 有 意义 。 子 信道 P 表示 开始 时 间 和 停止 时 间 ， 而 子 
信道 Q 包含 的 是 控制 信息 。 


4 bytes 
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byes bv 
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Error-Detection | _ Error-Detection and Correction | Correction 


2336 bytes 





Mode | 






User Data 


7-15 ”CD 数据 扇 区 的 格式 


大 多 数 光 盘 以 一 个 恒定 的 线 速 度 (constant linear velocity，CLV) 来 操作 。 这 就 是 说 ， 激 光 经 过 
各 个 扇 区 的 速率 始终 保持 恒定 ， 而 不 管 这 些 扇 区 是 位 于 光盘 的 开始 部 分 还 是 结束 部 分 。 因 此 ， 为 了 保 
持 恒 定 的 线 速度 ， 访 问 外 层 光 罗 时 要 比 访 问 内 层 光 轨 时 加 快 光盘 的 旋转 速度 。 一 个 扇 区 是 按照 激光 束 
沿 着 光 轨 从 光盘 开始 处 (光盘 申 央 ) 运行 到 该 扇 区 所 需要 时 间 的 分 秒 数 来 编号 。 我 们 还 要 对 这 些 “ 分 
秒 数 ”进行 定 标 ， 这 里 的 基本 假设 是 CD 播放 器 每 秒 处 理 75 个 扇 区 。 计 算 机 CD-ROM 驱动 器 的 速度 
已 经 快 达到 Audio CD 速度 的 竹 信 《44X)， 今 后 肯定 会 更 快 。 为 了 定位 到 某 个 指定 的 扇 区 上 ， 激 光头 
的 滑动 支架 会 垂直 于 光 轨 的 方向 移动 ， 尽 可 能 准确 地 猜测 指定 扇 区 的 可 能 位 置 。 在 随意 读 取 某 个 肩 区 
后 ， 激 光头 沿 着 光 轨 到 达 指 定 的 扇 区 。 

光盘 中 的 扇 区 可 以 有 三 种 不 同 格式 ， 具 体 是 哪 种 格式 要 取决 于 记录 数据 所 用 的 模式 。 这 里 有 三 种 
不 同 的 模式 。 模 式 0 和 模式 2 用 来 记录 音乐 ， 没 有 纠 错 能 力 。 模 式 1 用 来 记录 数据 ， 有 两 级 错误 检测 
和 校正 功能 。 这 些 格 式 的 具体 分 布 如 图 7-15 所 示 。 使 用 模式 1 记录 的 CD 的 总 容量 为 650MB。 模 式 0 


答 入 /和 葵 出 和 人 疗 储 系统 205 


33 17-bit Symbols 



















Small | Demodulation 
Frame V 98 of these = 1 sector 
bits Cross-Interleaved 
PQRSTUY Payload Reed-Soloman 
Small Code(CIRC) 
Erome [| 898-bit 
Numbes yy Subchannels [| 98 24-byte 


Subchannel Q 
(98 bits) 


Solee| oo。 | Css 
图 7-16 CD 的 物理 格式 和 逻辑 格式 


和 模式 2 则 能 够 保存 742MB 的 信息 ， 但 不 能 可 靠 地 用 来 记录 数据 。 

如 果 使 用 多 时 间 段 (session)〉 的 记录 方式 ，CD 中 的 轨道 间距 可 以 大 于 1.6 微米 。Audio CD 在 各 
个 段 中 都 可 以 记录 不 同 的 歌曲 ， 如 果 从 下 面 看 ， 这 些 时 间 段 是 一 些 不 断 扩 大 的 同 中 心 环 。 当 CD 开始 
用 做 数据 存储 时 ， 这 种 音乐 中 “记录 时 间 ” 的 思想 没有 做 任何 的 修改 ， 就 直接 扩展 到 包括 数据 记录 的 
时 间 段 。CD 有 多 达 99 个 时 间 段 。 对 于 CD 的 各 个 时 间 段 的 界定 为 : 由 一 个 段 内 数据 内 容 表 的 4500 个 
扇 区 〈 时 间 为 1 分 钟 ) 引入 (lead-in) 和 结尾 部 分 的 一 个 6750 扇 区 或 者 2250 扇 区 引出 〈lead-out， 或 
者 runout) 。 光 盘 上 的 第 一 个 时 间 段 中 有 一 个 6750 扇 区 引出 部 分 ， 而 后 面 的 其 他 时 间 段 的 引出 部 分 则 
比较 短 。 在 CD-ROM 上 ， 引 出 部 分 用 来 存放 属于 段 内 数据 的 目录 信息 。 


7:5x2, ;DVD 


多 功能 数码 光盘 (digital versatile disk)， 或 者 简称 DVD (以 前 称 为 数字 视频 光盘 ，digital video 
disk) ， 被 认为 是 CD 密度 的 4 倍 。DVD 的 旋转 速度 大 约 是 CD 速度 的 3 倍 。DVD 四 坑 的 尺寸 大 约 是 
CD 四 坑 的 一 半 (0.4 到 2. 13 微米 )， 而 光 轨 间距 为 0.74 微米 。 像 CD 一 样 ，DVD 分 为 可 刻录 和 不 可 
刻录 。 与 CD 不 同 的 是 ，DVD 有 单 面 或 双 面 ， 单 层 或 双 层 多 种 形式 。 单 层 单 面 的 DVD 能 存储 4. 78GB 
的 数据 ， 而 双 层 双 面 的 DVD 可 以 容纳 17GB 的 数据 。DVD 的 扇 区 大 小 为 2048 字 节 ， 与 CD 一 样 支 持 
三 种 数据 模式 。 由 于 具有 更 高 的 数据 密度 和 更 快 的 存 取 速度 ， 因 此 大 家 都 认为 DVD 会 最 终 会 替换 CD 
成 为 长 期 数据 存储 器 和 信息 发 布 介质 。 


7.5.3 光盘 记录 方法 
CD 和 DVD 有 不 同 的 记录 技术 。 最 经 济 ， 也 是 最 普遍 的 方法 是 使 用 热 敏 染料 。 这 种 染料 夹 在 聚 碳 
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酸 酯 基 片 和 CD 反射 涂 层 之 间 。 当 被 激光 发 出 的 光照 射 撞击 时 ， 这 种 染料 就 会 在 聚 碳酸 酯 基 片 上 产生 
一 个 媚 坑 。 这 种 四 坑 会 影响 CD 反射 层 的 光学 特性 。 

可 重 写 光学 介质 ， 如 CD-RW， 则 是 采用 一 种 金属 合金 来 代替 CD-R 光盘 上 的 染料 和 反射 涂 层 。 这 
种 金属 合金 中 包括 不 稳定 元 素 ， 如 钠 、 太 、 匀 和 银 等 。 在 正常 的 状态 下 ， 这 种 合金 涂 层 可 以 反射 激光 。 
但 是 ， 如 果 利 用 激光 将 这 种 合金 加 热 到 500'C 时 ， 合 金 就 会 发 生 某 种 分 子 变 化 ， 并 且 合 金 的 反射 率 会 
降低 。 化 学 家 和 物理 学 家 们 把 这 种 过 程 称 为 相交 (phase change)。 如 果 只 是 将 这 种 合金 涂 层 加 热 到 
200C ， 那 么 合金 会 回 到 原来 的 反射 状态 。 这 样 一 来 ， 光 盘 上 的 数据 可 以 任意 改变 多 次 。 但 是 ， 专 家 提 
醒 大 家 ， 利 用 相 变 原理 的 CD 记录 “只 ”能 工作 1000 次 左右 。 

WORM 驱动 器 ,通常 使 用 在 一 些 大 型 计算 机 系统 上 。WORM 系统 采用 了 比 个 人 所 使 用 的 光盘 系 
统 更 高 能 景 的 激光 。 这 里 ， 低 能 量 的 激光 用 来 读 取 数 据 ， 而 高 能 量 激 光 则 用 于 不 同 的 、 也 是 更 持久 的 
记录 方法 。 其 中 的 三 种 方法 如 下 : 

“ 烧 录 (Ablative) : 利用 高 能 量 的 激光 在 位 于 光盘 保护 层 之 间 的 反射 金属 涂 层 里 熔化 一 个 四 坑 。 

。 双 人 金属 合金 〈Bimetallic Altoy) : 在 光盘 表面 的 保护 涂 层 之 间 封 人 两 个 金属 涂 层 。 利 用 激光 将 这 

两 种 金属 熔 合 在 一 起 ， 引 起 下 面 的 金属 层 的 反射 率 发 生 改 变 。 双 金属 合金 的 WORM 光盘 的 制造 

商 声 称 这 种 介质 可 以 完好 保持 100 年 。 | 

。 成 泡 (Bubble-Forming) : 在 两 个 塑料 层 之 间 压 人 一 个 单个 热 敏 感 材料 层 。 当 被 高 能 量 激光 照射 

撞击 时 ， 热 敏 性 材料 中 将 产生 气泡 ， 引 起 反射 率 的 改变 。 

尽管 CD-ROM、CD-R 和 CD-RW 光盘 可 以 使 用 相同 的 帧 格式 ， 但 在 某 些 CD-ROM 驱动 右上 可 能 
无 法 读 取 数据 。 产 生 这 种 不 兼容 性 的 原 央 可 能 是 由 于 CD-ROM 光盘 上 的 信息 总 是 要 被 记录 (或 压 人 ) 
到 某 个 单 段 内 。 另 一 方面 ， 如 果 CD-R 和 CD-RW 光盘 能 够 像 软 盘 一 样 按 增 景 的 方式 写 和 人 信息， 那么 它 
们 会 变 得 非常 有 用 。 第 一 个 CD-ROM 规范 ，ISO 9660， 规 定 了 单 段 的 记录 格式 ， 而 且 光 盘 的 总 段 数 不 
多 于 99 个 。 人 们 很 快 认识 到 ISO 9660 的 这 些 限制 阻碍 了 光盘 产品 的 更 广泛 地 应 用 ， 于 是 ， 一 些 CD-R 
和 CD-RW 主导 制造 厂商 就 成 立 了 一 个 协会 来 协商 解决 这 个 问题 。 经 过 他 们 努力 ， 最 后 开发 了 一 种 通 
用 光盘 格式 规范 (Universal Disk Format Specification，UDF)， 这 种 光盘 记录 格式 不 限制 每 个 光盘 上 
的 记录 段 的 数量 。 这 种 新 格式 的 核心 思想 是 ， 用 一 个 浮动 不 固定 的 内 容 表 来 替换 原来 与 每 个 记录 段 相 
关联 的 内 容 表 。 这 种 浮动 的 内 容 表 称 为 虚拟 分 配 表 (virtual allocation table，VAT) ， 它 会 被 写 到 光盘 
上 紧 跟 在 用 户 数据 的 最 后 一 个 肩 区 后 面 的 引出 部 分 。 当 有 数据 需要 添加 到 前 面 某 个 已 有 内 容 的 记录 段 
上 时 ， 我 们 可 以 在 新 数据 写 人 后 ， 对 VAT 进行 重 写 。 这样 的 增 量 写 人 过 程 可 以 持续 下 去 ， 直 到 VAT 
到 达 光 盘 的 最 后 一 个 可 用 扇 区 。 


7.6 磁带 


磁带 是 一 种 最 古老 和 最 经 济 的 大 容量 存储 设备 。 第 一 代 的 数据 记录 磁带 使 用 类 似 于 录音 机 磁带 的 
相同 材料 制造 而 成 。 这 种 磁带 是 在 半 寸 宽 (1. 25 厘米 ) 的 醋酸 纤维 素 薄膜 带 的 表面 上 涂 散 一 层 磁性 氧 
化 物 ， 并 将 1200 英尺 长 的 材料 缠绕 在 一 根 卷轴 上 ， 然 后 手工 连接 到 磁带 驱动 器 。 这 种 磁带 驱动 器 的 大 
小 与 一 个 小 冰箱 相当 。 早 期 磁带 的 容量 一 般 低 于 11MB， 而 且 需 要 将 近 半 个 小 时 才能 读 或 者 写 完整 个 
卷轴 。 

磁带 上 的 数据 记录 方式 是 每 次 写 人 一 个 字 节 ， 对 于 数据 的 每 一 位 都 要 创建 一 个 磁道 。 另 外 增加 一 
个 磁道 来 检验 数据 的 奇偶 性 ， 这 样 使 得 磁带 共有 九条 磁道 宽 ， 如 图 7-17 所 示 。 这 种 九 磁道 的 磁带 采用 
的 是 相位 调制 编码 方式 和 奇偶 校 验 。 奇 偶 校 验 采 用 的 奇 校 验 ， 以 保定 在 一 长 串 零 (0s) 的 传输 过 程 中 
至 少 发 生 一 次 磁 通 量 的 “ 反 转 ”变化 ， 这 是 数据 库 的 记录 方式 的 特征 。 

在 过 去 的 时 间 里 ， 磁 带 技 术 的 更 新 是 非常 显著 的 。 许 多 制造 厂商 在 磁带 的 每 一 线性 英寸 中 不 断 地 
加 入 更 多 的 字 节 数 。 更 高 密度 的 磁带 不 仅 对 购买 和 存储 来 说 更 加 经 济 ， 而 且 可 以 使 数据 的 备份 工作 更 
加 快捷 。 也 就 是 说 ， 如 果 系 统 在 拷贝 文件 时 必须 脱 机 ， 使 用 高 密度 磁带 所 造成 的 系统 停工 时 间 就 会 相 
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HELLO 
道 0 1111011111 11111011111 11111011 ni 
磁道 11] + 11111 11111111 
00000010000 。 00000010000 00000010 
00 00 0 00 00 0 00111001 
磁道 4 P0000000100 5 10000000100. 10000000 
0100101100 010010 人 01001011 
0011101101 00111011 
磁道 8 0 0900110 0 0000110 01110000 
(奇偶 校 验 ) 1 01000000000 二 01000000000 01000000 
EBCDIC 编码 : l 记录 个 : 机 数据 块 
H = 11001000 W = 11100110 记录 间隙 记录 间隙 
E = 11000101 0 = 11010110 
L = 11010011 R = 11011001 
L = 11010011 L = 11010013 
0 = 11010110 D = 11000100 


[space] = 01000000 
图 7-17 一 个 九 磁道 的 磁带 格式 
对 减少 。 如 果 在 写 和 磁带 前 ， 对 数据 进行 压缩 处 理 还 可 以 进一步 节约 成 本 (参见 7. 8 节 )。 

各 种 磁带 的 革新 技术 所 带 来 的 后 果 是 ， 产 生 了 太 多 的 磁带 标准 和 出 现 了 知识 产权 技术 。 各 种 尺寸 
和 容量 的 盒 〈 卡 ) 式 磁带 已 经 取代 了 原来 的 九 磁道 开放 式 的 卷轴 磁带 。 类 似 于 数字 记录 ， 磁 带 上 使 用 
的 薄膜 涂 层 已 经 取代 了 原来 的 氧化 物 涂 层 。 现 在 的 磁带 支持 各 种 不 同 的 磁道 密度 ， 并 且 采 用 蛇 形 或 螺 
旋 扫 描记 录 方 法 。 

蛇 形 (serpentine) 记录 方法 是 将 数据 位 按照 串 行 方式 存放 在 磁带 上 。 与 九 磁 道 格 式 中 字 节 垂直 于 
磁带 边缘 的 存放 方式 不 同 ， 蛇 形 记录 方法 将 字 节 沿 磁带 长 度 方向 “纵向 ”地 写 人 人， 每 个 字 节 都 平行 于 
磁带 的 边缘 排列 。 数 据 流 会 沿 着 磁带 的 长 度 方向 写 人 直到 磁带 的 末端 ， 然 后 将 磁带 反 转 ， 在 第 一 个 磁 
道 下 面 的 一 个 磁道 写 人 数据 ， 如 图 7-18 所 示 。 这 种 写 人 过 程 会 一 直 持 续 下 去 ， 直 到 写 完 磁带 上 的 全 部 
磁道 容量 。 数 字 线 性 磁带 (digital linear tape，DLT) 和 1/4 英寸 盒 式 (quarter inch cartridge，QIC) 
系统 使 用 蛇 形 记录 方法 ， 每 个 磁带 上 有 50 条 或 者 更 多 的 磁道 。 


0010011010100010011 村 一 刘 洒 及 二 





100100110101000100111101001101000001001001 
> 生生 六 100100010110011011000101 









100100110101000100111101001101000001001001 
00110110100001001100100010110011011000101 
> 1001110101010010000 宣 二 请 王 床 < 







图 7-18 在 蛇 形 线 式 磁带 上 的 三 次 记录 运动 方式 
数字 音频 磁带 (digital audio tape，DAT) 和 8mm 磁带 系统 使 用 螺旋 (helical) 扫描 记录 方法 。 在 
其 他 的 记录 系统 中 ， 磁带 都 是 直接 通过 一 个 固定 的 磁头 ， 类 似 于 录音 机 中 磁带 的 运动 方式 。DAT 系统 
是 将 磁带 通过 一 个 倾斜 的 旋转 鼓 轮 (或 称 为 绞盘 ，capstan) ， 鼓 轮 上 分 别 有 两 个 读 出 头 和 两 个 写 人 头 ， 
如 图 7-19 所 示 。 在 写 和 人 操作 过 程 中 ， 当 写 入 完成 时 ， 读 出 头 便 检验 数据 的 完整 性 。 绞 盘 以 2000RPM 
的 速度 旋转 ， 旋 转 方向 与 磁带 移动 的 方向 相反 。 这 种 结构 与 VCR 上 使 用 的 机 制 很 相似 。 这 两 个 读 / 写 
头 的 联动 装置 以 相互 间 成 40 度 角 的 方式 写 入 数据。 由 于 数据 是 通过 两 个 磁头 交 迭 写 人 ， 所 以 增加 了 记 
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录 密 度 。 螺 旋 扫 描 系 统 的 记录 一 般 比较 慢 ， 并 且 磁 带 会 比 采用 简单 磁带 路 径 的 蛇 形 记录 系统 更 容易 磨损 。 





b) 磁带 上 的 数据 写 人 模式 
图 7-19 ”一 种 螺旋 扫描 记录 


磁带 存储 系统 从 一 开始 就 是 大 型 计算 机 使 用 的 主要 产品 。 一 般 看 来 ,磁带 以 便宜 的 价格 提供 了 
“无 限 ”的 存储 量 。 磁 带 会 继续 成 为 大 型 计算 机 系统 上 文件 存储 和 系统 备份 的 主要 介质 。 尽 管 磁带 这 种 
介质 本 身 非常 便宜 ， 但 是 对 磁带 进行 目录 编制 和 处 理 的 代价 可 能 会 很 高 ， 特 别 是 当 磁 带 库 中 包含 成 百 
上 千 的 磁带 卷 时 。 考 虑 到 这 个 问题 ， 一 些 厂商 生产 了 各 种 各 样 的 可 以 在 几 秒 内 对 磁带 进行 编目 ， 取 带 
和 装 带 操作 的 自动 机 械 装 置 。 很 多 大 型 数据 中 心 都 使 用 自动 磁带 库 (robotic tape library)， 也 被 称 为 磁 
带 仓库 (tape silo) 。 现 在 ， 最 大 的 自动 磁带 库 可 以 有 几 百 万 亿 字 节 (terabytes) 的 容量 ， 并 且 能 根据 
用 户 的 请 求 在 半分 钟 内 装 好 所 需 的 磁带 盒 。 


7.7 独立 磁盘 宛 余 阵列 


在 IBM 公司 的 RAMAC 计算 机 引入 后 的 30 年 里 ， 只 有 一 些 最 大 型 的 计算 机 具有 磁盘 存储 系统 。 
早期 的 磁盘 驱动 器 非常 昂贵 ， 而 且 与 存储 器 容量 成 比率 地 占用 大 量 的 场地 面积 。 磁 盘 系 统 需要 一 个 严 
格 受 控 的 工作 环境 : 太 热 会 破坏 控制 电路 ;潮湿 太 低 可 能 会 引起 静电 累积 ， 而 使 磁盘 表面 磁 通 量 的 极 
化 方向 出 现 混 乱 。 磁 头 撞 损 ， 或 者 其 他 不 可 修复 的 磁盘 错误 ， 在 商业 、 科 研 和 学 术 领 域 可 能 造成 难以 
估量 的 损失 。 如 果 在 临近 工作 日 结束 时 发 生 磁头 撞 损 意外 ， 就 意味 着 今天 所 有 的 数据 输入 都 必须 从 上 
次 备份 点 起 〈 通 常 是 昨天 晚上 ) 重新 开始 。 

很 显然 ， 这 种 情形 是 大 家 都 不 能 接受 的 。 而 且 ， 随 着 人 们 对 电子 数据 存储 设备 的 依赖 程度 越 来 越 
高 ， 这 种 情况 会 变 得 越 来 越 严 重 。 长 期 以 来 ， 人们 一 直 在 寻找 各 种 可 能 的 解决 办 法 。 归 根 结 底 ， 磁 盘 
还 不 是 非常 可 靠 。 当 然 ， 制 造 更 可 靠 的 磁盘 也 只 是 解决 方法 的 一 部 分 。 

1988 年 ， 美 国 加 州 大 学 Berkeley 分 校 的 David Patterson、Garth Gibson 和 Randy Katz 三 人 发 表 了 
一 篇 题 为 “廉价 磁盘 的 元 余 阵列 的 实例 ”的 论文 。 首 次 创造 出 了 RAID 一 词 。 在 论文 中 他 们 介绍 了 如 
何 利 用 若干 数量 的 “廉价 ”小 磁盘 (例如 微机 使 用 的 磁盘 ) 来 蔡 代 通常 用 在 大 型 机 上 的 大 型 昂贵 的 单 
磁盘 (single large expensive disk，SLED)， 来 提高 大 型 机 磁盘 系统 的 可 靠 性 和 性 能 。 因 为 “廉价 ” 
(inexpensive) 一 词 的 意思 是 相对 的 ， 而 且 可 能 会 被 误导 ， 所 以 现在 大 家 普遍 接受 的 这 个 缩写 词 的 正确 
意思 是 独立 磁盘 完 余 阵列 (Redundant Array of Independent Disk，RAID) 。 

在 这 篇 论文 中 ，Patterson、Gibson 和 Katz 定义 了 5 种 类 型 的 〈 称 为 级 ，level) 的 RAID， 每 一 级 
RAID 都 具有 不 同 的 性 能 和 可 靠 性 特征 。 原 先 这 些 级 别 的 编号 是 从 1 到 5， 后 来 大 家 又 定义 了 RAID 的 
第 0 级 和 第 6 级 。 当然， 各 个 厂商 还 创造 了 其 他 的 一 些 RAID 级 ， 也 许 这 些 层次 在 今后 可 能 也 会 成 为 
行业 的 标准 。 这 些 级 一 般 都 是 被 大 家 普遍 接受 的 RAID 级 的 组 合 形式 。 本 节 将 简单 介绍 7 个 RAID 级 
的 每 个 层次 ,以 及 几 个 混合 系统 。 这 些 混合 系统 为 了 满足 某 些 特殊 的 性 能 和 可 靠 性 要 求 ， 而 由 : 开 个 不 
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一 


同 的 RAID 级 构成 的 。 
7.7.1 RAID Level0 


RAID Level 0, 或 简称 RAID-0， 是 将 数据 块 以 条 带 (stripe) 的 形式 存放 在 几 个 磁盘 表面 上 ， 这 
样 一 个 记录 就 会 占用 几 个 磁盘 表面 的 多 个 扇 区 ， 如 图 7-20 所 示 。 这 种 方法 也 称 为 磁盘 跨 区 、 块 交错 数 
据 分 带 或 磁盘 分 带 。 分 带 是 简单 地 将 逻辑 顺序 的 数据 进行 分 段 ， 以 便 把 各 个 分 段 可 以 写 到 多 个 物理 设 
备 上 。 这 些 分 段 可 以 小 到 一 个 单一 位 ， 如 在 RAID-0 中 ,或 者 是 某 个 特定 大 小 的 块 。 


WEATHER REPORT FOR 14 NOVEMBER: PARTLY CLOUDY WITH PERIODS OF RAIN. SUNRISE 0608. 






图 7-20 ”使 用 RAID-0 写 入 的 一 个 记录 ， 没 有 宛 余 的 块 交错 数据 分 带 的 方式 

因为 RAID-0 不 提供 完 余 ， 所 以 在 各 种 RAID 的 配置 结构 中 ，RAID-0 具有 最 佳 性 能 。 特 别 是 ， 如 
果 每 一 个 磁盘 都 有 自己 独立 的 控制 器 和 高 速 缓存 。 并 且 RAID-0 非常 廉价 。RAID-0 存在 的 问题 在 于 系 
统 的 整体 可 靠 性 仅仅 为 单个 磁盘 的 期 望 性 能 的 一 部 分 〈 几 分 之 一 )。 例 如 ， 如 果 阵 列 由 5 个 磁盘 组 成 ， 
每 个 磁盘 的 设计 寿命 为 50 000 小 时 〈 大 约 6 年 )， 那 么 整个 系统 的 期 望 设 计 寿 命 为 50 000/5 一 10 000 小 
时 〈 大 约 14 个 月 )。 当 磁盘 数 增加 时 ， 失 效 的 概率 会 随 之 增加 ， 最 后 达到 某 个 确定 不 变 的 值 。 因 为 没 
有 宛 余 ， 所 以 RAID-0 没有 容错 能 力 。 因 此 ，RAID-0 所 能 提供 的 唯一 好 处 是 性 能 。 显 然 ，RAID 缺乏 
可 靠 性 会 引起 惊慌 。 通 常 ， 推 荐 RAID-0 用 于 一 些 非 关键 的 而 又 要 高 速 读 取 和 写 人 的 数据 ， 或 者 是 改 
变 不 太 频繁 和 经 常 定期 备份 的 数据 和 要 求 低 成 本 的 场合 ， 以 及 用 于 如 视频 ， 图 像 编 辑 之 类 的 应 用 程序 。 


7.7.2 RAID Level 1 


RAID Level 1, 或 者 简称 RAID:1 (也 称 为 磁盘 镜像 ，disk mirroring)， 是 所 有 的 RAID 级 中 具有 
最 佳 失效 保护 的 一 种 方案 。RAID-1 在 每 次 写 人 数据 时 ， 都 会 将 数据 复制 到 磁盘 驱动 器 中 ， 称 为 镜像 盘 
(thirror set， 或 shadow set) 的 第 二 组 磁盘 上 ， 如 图 7-21 所 示 。 这 种 安排 提供 了 令 人 满意 的 性 能 ， 特 
别 是 在 镜像 驱动 器 与 主 驱动 器 相差 180" 同 步 旋转 时 。 尽 管 写 入 性 能 要 比 RAID-0 慢 (因为 数据 必须 写 
两 次 ), 但 是 RAID-1 的 读 取 速 度 更 快 ， 因 为 系统 可 以 从 更 接近 目标 扇 区 的 磁盘 驱动 臂 上 读 取 数 据 。 这 
样 在 读 取 数 据 时 ， 会 减少 一 半 的 旋转 反应 时 间 。RAID-1 最 适合 于 面向 事务 、 高 可 用 率 的 工作 环境 ， 和 
其 他 一 些 需 要 高 容错 率 的 应 用 ， 例 如 会 计 或 工资 表 。 





7-21 RAID 1、 磁盘 镜像 
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7.7.3 RAID Level 2 


RAID-1 方案 的 主要 问题 是 成 本 代价 高 : 存储 一 定数 量 的 数据 ， 却 需要 使 用 两 倍 的 磁盘 容量 。 显 
然 ， 更 好 的 方式 是 只 使 用 磁盘 组 中 的 一 个 或 几 个 磁盘 来 存储 其 他 磁盘 中 的 数据 信息 。RAID-2 就 定义 了 
这 些 方法 中 的 其 中 一 种 。 

RAID-2 将 数据 分 带 的 思想 运用 到 了 极端 的 情形 。RAID-2 在 每 个 条 带 中 只 写 人 一 位 的 数据 ， 而 不 
是 采用 任意 大 小 的 块 写 人 数据 ， 如 图 7-22 所 示 。 这 样 至 少 需要 8 个 磁盘 表面 才能 存放 数据 。 另 外 ， 还 
需要 一 组 磁盘 驱动 器 存放 纠 错 信息 ， 这 些 纠 错位 是 采用 海 明 编码 生成 的 。 





图 7-22 RAID-2 采用 海 明 编码 的 位 交错 的 数据 分 带 方式 


纠正 单位 错误 的 海 明 编 码 所 需要 的 驱动 器 数目 与 需要 被 保护 的 数据 驱动 器 的 记录 表 的 数目 成 正 
比 。 如 果 磁 盘 阵列 中 的 任何 一 个 驱动 器 损坏 ， 可 以 使 用 海 明 编 码 字 来 重建 这 个 出 错 的 驱动 器 (显然 ， 
海 明 驱 动 器 也 可 以 使 用 数据 驱动 器 来 进行 重建 ) 。 

因为 每 个 驱动 器 都 只 写 人 一 位 数据 ， 所 以 整个 RAID-2 的 磁盘 组 就 好 像 是 一 个 大 型 的 数据 磁盘 。 
所 有 可 用 存储 容量 是 各 个 数据 驱动 器 存储 容量 的 总 和 。 所 有 的 驱动 器 ， 包 括 海 明 驱 动 器 ， 都 必须 严格 
地 同步 。 否 则 ,数据 会 变 乱 ， 海 明 驱 动 器 也 就 起 不 作用 。 因 为 生成 海 明 编程 非常 耗 时 ， 所 以 RAID-2 
对 大 多 数 商 业 应 用 来 说 速度 太 慢 事实 上 , 今天 大 多 数 的 硬盘 驱动 器 都 有 内 置 的 CRC 纠 错 功能 。 但 
是 ，RAID-2 方 式 在 RAID-1 和 RAID-3 之 间 构 建 了 一 条 理论 桥梁 ,使 这 两 种 方式 都 应 用 在 现实 世 
界 中 。 


7.7.4 RAID Level 3 


像 RAID-2 一 样 ，RAID-3 是 按照 每 次 一 位 的 方式 将 数据 交错 分 配 到 各 个 数据 驱动 器 的 条 带 中 。 但 
是 ， 与 RAID-2 所 不 同 的 是 ，RAID-3 只 使 用 一 个 驱动 器 来 保存 一 个 简单 的 奇偶 校 验 位 ， 如 图 7-23 所 
示 。 这 种 奇偶 校 验 位 使 用 专门 的 硬件 很 快 就 计算 出 来 ， 具 体 方法 是 对 每 一 个 数据 位 〈 用 6b 表示 ) 执行 
一 个 如 下 所 示 的 异 或 〈XOR) 操作 〈 对 偶 校 验 ) : 

Parity = bo XORb1 XORb» XORb3 XORb4 XORbs XORbe XORb7 
等 价 为 : 

Parity 二 bo 十 抽 十 bz 十 b3 十 b4 十 bs 十 be 十 b7(mod 2) 

利用 这 种 相同 的 计算 方法 可 以 对 一 个 损坏 的 驱动 器 进行 重建 。 例 如 ， 假 设 第 6 号 驱动 器 损坏 ， 并 
且 被 替换 掉 。 我 们 可 以 对 其 他 7 个 数据 驱动 器 上 的 数据 和 奇偶 校 验 驱动 器 上 的 数据 按 如 下 方式 进行 计 
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奇偶 校 验 位 












| Parity (even) | Party (even) | 
Letter| RSCII High 
Moe ithe 


: : 
A 3 1 
0 1 
H 1 1 
E 1 0 
R 0101 0010| 0 1 


图 7-23 RAID-3: 使 用 奇偶 校 验 的 数据 分 割 位 交错 磁盘 
算 ， 以 恢复 第 6 号 磁盘 上 的 数据 : 
b6 = bo XORb1 XORbs XORb3 XORbs XORbs XOR Parity XORb 
RAID-3 要 求 使 用 与 RAID-2 相同 的 数据 复制 方法 和 同步 操作 ， 但 是 RAID-3 比 RAID-1 和 RAID-2 
都 更 经 济 ， 因 为 它 只 使 用 一 个 驱动 器 进行 数据 保护 。RAID-3 在 一 些 商 业 计 算 机 系统 上 已 经 使 用 了 很 多 
年 ， 但 是 RAID-3 不 太 适 合 应 用 于 面向 事务 的 应 用 程序 。RAID-3 最 适合 需要 读 写 大 块 数据 块 的 情况 ， 
例如 图 像 或 视频 处 理 的 应 用 。 


7.7.5 RAID Level 4 






RAID-4, 像 RAID-2 一 样 ， 是 另外 一 个 “理论 上 的 ”RAID 级 。 如 果 将 RAID-4 应 用 于 Patterson 
等 人 所 描述 情况 ，RAID-4 的 性 能 会 很 糟糕 。 一 个 RAID-4 的 磁盘 阵列 ， 像 RAID-3 一 样 ， 由 一 组 数据 
磁盘 和 一 个 奇偶 校 验 位 磁盘 组 成 。RAID-4 将 数据 写 人 到 统一 大 小 的 条 带 中 ， 而 不 是 每 次 写 人 一 个 数据 
位 到 各 个 驱动 器 上 。RAID-4 会 在 所 有 的 驱动 器 上 都 创建 一 个 大 小 相同 的 条 带 ， 就 如 同 RAID-0 所 描述 
的 情况 。 通 过 对 数据 带 的 数据 位 相互 间 进 行 XOR 操作 来 创建 奇偶 校 验 条 带 。 

我 们 可 以 认为 RAID-4 是 带 有 奇偶 校 验 的 RAID-0 方式 。 但 是 ， 增 加 奇偶 校 验 会 导致 系统 性 能 的 严 
重 下 降 ， 原 因 是 数据 盘 对 奇偶 校 验 盘 的 争 用 。 例 如 ， 假 设 把 PAID-4 数据 写 人 到 跨越 了 5 个 磁盘 (其 
中 ，4 个 数据 盘 和 一 个 奇偶 校 验 盘 ) 的 条 带 3 中 ， 如 图 7-24 所 示 。 首 先 ， 我 们 必须 读 取 当 前 占据 条 带 3 
的 数据 以 及 对 应 的 奇偶 条 带 。 将 原来 的 数据 与 新 的 数据 执行 XOR 操作 ， 得 出 新 的 奇偶 校 验 。 然 后 写 人 
数据 带 ， 同 时 更 新 奇偶 校 验 条 带 。 





奇偶 1-4= (条 带 1)XOR( 条 带 2)XOR( 条 带 3)XOR( 条 带 4) 
.图 7-24 RAID-4,， 带 一 个 奇偶 校 验 盘 的 块 交错 数据 条 带 
设想 一 下 ， 当 我 们 正在 处 理 奇 偶 校 验 块 时 如 果 有 写 人 请 求 等 待 ， 例如 有 一 个 条 带 1 的 写 人 请 求 和 
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一 个 条 带 4 的 写 人 请 求 ， 磁 盘 系 统 将 发 生 什 么 情况 呢 ? 如 果 正 在 使 用 RAID-0 或 RAID-1 的 话 ， 这 两 个 
等 待 的 请 求 就 可 能 与 写 人 条 带 3 的 操作 一 起 被 同时 并 发 地 服务 。 这 样 ， 奇 偶 校 验 驱动 器 就 变 成 了 一 个 
瓶颈 ， 从 而 丧失 了 多 磁盘 系统 所 具有 的 所 有 性 能 优势 。 

有 些 作 者 建议 如 果 将 条 带 的 大 小 和 要 被 写 人 的 数据 记录 大 小 进行 优化 处 理 ，RAID-4 的 性 能 可 以 得 
到 改善 。 还 有 ， 这 种 方法 对 数据 占用 相同 大 小 的 记录 的 应 用 程序 〈 例 如 声音 或 视频 处 理 程序 ) 会 有 好 
处 。 然 而 ， 大 多 数 的 数据 库 应 用 都 涉及 到 记录 大 小 的 变化 范围 很 大 的 数据 ， 使 得 我 们 不 可 能 对 数据 库 
中 的 大 量 记 录 找 到 一 个 “最 佳 ”的 长 度 大 小 。 因 为 RAID-4 的 性 能 差 ， 所 以 在 商业 上 并 没有 得 到 应 用 。 


7.7.6 RAID Level 5 


大 多 数 人 都 认为 RAID-4 可 以 对 单一 磁盘 出 错 的 情况 提供 足够 的 保护 。 但 是 ， 由 于 奇偶 校 验 盘 所 
导致 的 瓶颈 问题 ， 使 得 RAID-4 不 适合 应 用 在 需要 高 事务 吞吐 量 的 环境 中 。 可 以 肯定 地 说 ， 如 果 考 虑 
某 种 类 型 的 负载 平衡 ， 将 奇偶 校 验 位 写 到 多 个 磁盘 而 不 只 是 一 个 磁盘 上 ， 吞 吐 量 问 题 无 疑 会 得 到 改善 。 
这 也 正 是 RAID-5 要 做 的 事情 。RAID-5 是 RAID-4 将 奇偶 校 验 盘 分 散 到 整个 磁盘 阵列 中 的 情形 ， 如 图 
7-25 所 示 。 





奇偶 1-3= (条 带 1) XOR (条 带 2) XOR (条 带 3) 
图 7-25 RAID-5， 带 分 布 式 奇偶 校 验 的 块 交 错 数 据 条 带 

因为 一 些 请 求 能 被 并 发 地 服务 ， 所 以 RAID-5 在 所 有 的 奇偶 校 验 模型 中 提供 了 最 佳 的 读 操作 吞吐 
量 ， 并 且 在 写 操作 时 也 具有 令 大 满意 的 吞吐 量 。 例 如 ， 如 图 7-25 所 示 ， 磁 盘 阵列 可 以 同时 服务 一 个 对 
磁盘 4 第 6 条 带 和 一 个 对 磁盘 1 第 7 条 带 的 写 人 请 求 ， 因 为 这 些 服 务 请 求 无 论 是 奇偶 校 验 还 是 数据 操 
作 都 分 别 使 用 不 同 的 磁盘 驱动 臂 组 。 然 而 在 所 有 RAID 层次 中 ，RAID-5 需要 的 磁盘 控制 器 是 最 复杂 
的 。 

与 其 他 RAID 系统 相 比 ，RAID-5 能 够 以 最 少 的 成 本 代价 提供 最 佳 的 保护 。 正 因为 如 此 ，RAID-5 
在 商业 应 用 上 已 经 非常 成 功 。 在 所 有 以 RAID 为 基础 的 应 用 系统 中 ，RAID-5 安装 的 数量 是 最 大 的 。 
RAID-5 的 主要 应 用 领域 包括 : 文件 和 应 用 程序 服务 器 ， 邮 件 和 新 闻 服 务 器 ， 数 据 库 服务 器 和 Web 服 
务 器 等 。 


7.7.7 RAID Level6 


前 面 所 讨论 的 大 多 数 的 RAID 系统 只 能 允许 一 次 最 多 有 一 个 磁盘 出 错 。 问题 是 大 型 计算 机 系统 的 
磁盘 驱动 器 常常 有 成 群 成 能 失效 的 倾向 。 发 生 这 种 情况 一 般 有 两 大 原因 。 第 一 ， 几 乎 同一 时 间 生 产 的 
磁盘 会 在 相同 的 时 间 到 达 它 们 预期 使 用 寿命 的 终点 。 所 以 ， 如 果 被 告知 新 磁盘 组 的 使 用 寿命 大 约 是 6 
年 ， 那么 可 以 预计 第 6 年 磁盘 系统 就 会 有 问题 ， 或 许 出 现 多 个 磁盘 同时 并 发 失效 的 情况 。 

第 二 ,磁盘 驱动 器 的 损坏 通常 是 由 于 某 些 灾难 性 事件 引起 的 ， 比 如 电源 波动 。 电 源 波动 可 能 会 在 
同一 时 刻 毁 坏 所 有 的 磁盘 驱动 器 。 最 不 耐用 的 磁盘 最 先 损坏 ， 接 着 是 第 二 个 不 耐用 的 磁盘 损坏 ， 如 此 
持续 下 去 。 类 似 这 种 连续 的 磁盘 损毁 可 能 会 延续 几 天 甚至 几 周 的 时 间 。 如 果 这 些 磁 盘 的 持续 损坏 碰巧 
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在 磁盘 的 平均 修复 时 间 (Mean Time To Repair, MTTR) (包括 打 电 话 和 修复 人 员 到 达 所 需 时 间 ) 之 
内 发 生 ， 那 么 还 没有 替换 第 一 个 损坏 的 磁盘 之 前 第 二 个 磁盘 也 可 能 损毁 了 ， 因 而 整个 磁盘 阵列 就 变 得 
无 法 继续 使 用 和 服务 。 

对 于 具有 高 可 用 性 的 系统 必须 能 够 允许 多 个 磁盘 同时 并 发 失效 的 情况 发 生 ， 特 别 是 在 MTTR 可 能 
会 是 一 个 很 大 数字 的 情形 。 如 果 将 磁盘 阵列 设计 为 可 以 承受 两 个 磁盘 驱动 器 的 并 发 失效 ， 就 可 以 有 效 
地 把 MTTR 的 数字 扩大 一 倍 。 事 实 上 ，RAID-l 的 磁盘 系统 就 具有 这 种 生存 能 力 。 只 要 某 个 磁盘 及 其 
镜像 盘 不 在 同一 时 刻 失效 ， 那 么 RAID-1 磁盘 阵列 就 可 以 在 失去 一 半 磁 盘 后 还 能 够 生存 。 

RAID-6 提供 了 解决 这 种 大 量 磁盘 失效 问题 的 一 种 经 济 实用 的 方案 。 为 此 ，RAID-6 对 每 排 (rank) 
(或 者 每 个 水 平行 ) 驱动 器 使 用 了 两 组 纠 错 条 带 。 除 了 采用 奇偶 校 验 外 ，RAID-6 还 使 用 Reed-Soloman 
纠 错 编码 来 增加 第 二 层 保 护 。 为 每 个 数据 条 带 配置 两 个 检 错 的 条 带 当 然 会 增加 存储 器 的 成 本 。 如 果 没 
有 保护 的 数据 存储 在 N 个 磁盘 上 ， 那 么 RAID-6 增加 的 这 种 保护 就 需要 N 十 2 个 磁盘 。 因 为 需要 写 人 
两 类 奇偶 校 验 ， 所 以 RAID-6 所 提供 的 写 人 性 能 相当 差 。 一 种 RAID-6 的 配置 结构 如 图 7-26 所 示 。 





Q= 纠 错 编码 


图 7-26 RAID-6， 双 重出 错 保护 的 块 交 错 数 据 条 带 


直到 最 近 ， 还 没有 商业 配置 的 RAID-6 系统 。 产 生 这 种 情况 有 两 种 原因 。 第 一 ， 生 成 Reed-Solo- 
man 编码 需要 相当 大 的 费用 代价 。 第 二 ， 更 新 磁盘 上 的 纠 错 编码 要 求 双 倍 的 读 / 写 操作 。IBM 公司 是 第 
一 个 (到 现在 为 止 也 仅 有 的 一 个 ) 利 用 它们 的 RAMAC RVA 2 Turbo 磁盘 阵列 将 RAID-6 带 到 了 市 场 
上 。RVA 2 Turbo 磁盘 阵列 将 磁盘 条 带 的 运行 “日 志 记 录 ” 存 放 在 磁盘 控制 器 的 高 速 缓存 存储 器 中 ， 
以 消除 RAID-6 的 写 人 损失。 日 志 数 据 允许 磁盘 阵列 每 次 处 理 一 个 数据 条 带 ， 并 且 在 数据 被 写 人 磁盘 
前 为 整个 条 带 计 算 全 部 的 奇偶 校 验 位 和 纠 错 编码 。 在 这 里 ， 系 统 决 不 会 将 数据 重新 写 人 到 更 新 前 数据 
所 占据 的 同一 个 条 带 中 。 相 反 ， 一 旦 这 个 被 更 新 条 带 已 经 在 其 他 位 置 写 入 ， 那 么 这 个 先前 被 占用 的 条 
带 就 会 被 标记 为 空闲 空间 。 


7.7.8 混合 RAID 系统 


许多 大 型 的 计算 机 系统 并 不 局 限于 只 使 用 一 种 类 型 的 RAID。 在 某 些 情况 下 ， 平 衡 磁盘 系统 的 高 
可 用 性 和 经 济 性 是 非常 重要 的 。 例 如 ， 我 们 可 能 希望 使 用 RAID-1 来 保护 包含 操作 系统 文件 的 驱动 器 ， 
而 对 于 数据 文件 使 用 RAID-5 就 足够 了 。RAID-0 非常 适合 于 存放 长 程序 运行 过 程 仅 作为 暂时 使 用 的 
“临时 ”文件 ， 并 且 RAID-0 较 快 的 磁盘 访问 速度 可 以 有 效 地 减少 程序 执行 的 时 间 。 

有 时 ， 可 以 使 用 多 个 入 AID 方 案 组 合 起 来 构建 一 种 “新 型 ”的 RAID。RAID-10 就 是 这 样 一 种 磁盘 系 
统 ， 它 组 合 了 RAID-0 的 分 带 方式 和 RAID-1 的 镜像 功能 。 虽 然 代 价 非 常 昂贵 ， 但 是 RAID-10 可 以 提供 优 
良 的 读 取 性 能 和 最 佳 的 可 用 性 。 不 管 成 本 如 何 ， 还 是 有 几 套 RAID-10 系统 成 功 地 进入 了 商业 市 场 。 

在 阅读 了 前 面 几 节 的 内 容 后 ， 我 们 应 该 很 清楚 ， 编 号 较 高 的 RAID 层次 不 一 定 会 是 “更 好 ”的 
RAID 系统 。 无 论 如 何 ， 还 是 有 许多 人 会 很 自然 地 认为 更 高 编号 的 东西 通常 表示 要 比 编号 低 的 东西 更 
好 一 些 。 由 于 这 个 原因 ， 称 为 RAID 咨询 委员 会 (RAID Advisory Board，RAB) 的 行业 协会 最 近 已 经 





214 第 7 童 





在 组 织 和 重新 命名 上 述 的 RAID 系统 。 本 书 选择 保留 了 “Berkeley” 的 命名 方法 ， 因 为 这 种 命名 方法 得 
到 了 更 加 广泛 的 认同 。 


7.8 数据 压缩 


无 论 存储 器 多 便宜 ， 也 不 管 购买 的 数量 有 多 少 ， 我 们 似乎 从 来 都 不 会 认为 存储 器 系统 已 经 足够 。 
新 购买 的 巨大 磁盘 通常 很 快 就 会 装 满 原本 希望 可 以 存放 到 老 磁 盘 上 的 内 容 。 不 久 ， 我 们 就 又 开始 在 市 
场 上 购买 另 一 组 新 的 磁盘 系统 。 很 少 有 人 或 公司 可 以 拥有 无 限 的 资源 ， 因 此 我 们 必须 对 现 有 的 资源 进 
行 优化 使 用 。 优 化 方法 之 一 就 是 使 要 存储 的 数据 变 得 更 加 紧凑 ， 在 写 人 磁盘 之 前 对 数据 进行 压缩 。 实 
际 上 ， 可 以 使 用 压缩 技术 为 奇偶 校 验 或 镜 象 磁盘 组 留 出 空间 ,“ 免 费 ” 为 系统 增加 RAID! 

数据 压缩 除了 节省 空间 外 还 有 更 多 的 好 处 。 数据 压缩 同样 也 能 节省 时 间 和 帮助 优化 资源 。 例 如 ， 
如 果 压 缩 和 解压 的 操作 都 在 I/O 处 理 器 上 执行 ， 那 么 数据 移 人 和 移出 存储 器 子 系统 所 需要 的 时 间 就 会 ， 
更 少 ， 这 样 系统 就 会 有 更 多 的 时 间 让 1/O 总 线 做 其 他 的 工作 。 

在 通信 线路 中 使 用 数据 压缩 技术 发 送信 息 所 带 来 的 好 处 是 显而易见 的 ， 数据 传输 的 时 间 会 更 短 和 
主机 上 数据 存放 所 占用 的 空间 也 会 更 少 。 尽 管 这 个 问题 的 细节 研究 已 经 超出 了 本 书 的 范围 (读者 参阅 
本 章 的 参考 文献 部 分 可 以 获取 一 些 资料 ) ， 但 是 要 全 面 理解 /O 和 数据 存储 还 应 该 了 解 有 关 数 据 压 缩 的 
一 些 基 本 概念 。 

在 评估 不 同 的 压缩 算法 和 压缩 硬件 时 ， 我 们 通常 最 关心 的 是 压缩 算法 执行 的 速度 、 速 度 有 多 快 并 
且 使 用 这 种 数据 压缩 算法 后 一 个 文件 会 变 成 有 多 小 。 压 缩 系 数 〈compression factor) ， 有 时 称 为 压缩 比 
(compression ratio) ， 是 一 个 可 以 快速 计算 的 统计 量 。 事 实 上 ， 人 们 很 容易 理解 这 个 问题 。 计 算 压 缩 系 
数 有 多 种 不 同 的 方法 。 这 里 。 采 用 如 下 的 计算 方法 ， 


压缩 后 的 文件 大 小 ] 、 00 
压 纺 系数 一 1 一 | 医改 六 件 天 小 X100% 


例如 ， 假 设 开 始 有 一 个 100KB 的 文件 ， 然 后 使 用 某 种 压缩 算法 对 文件 进行 压缩 处 理 。 在 算法 完成 


后 ， 文 件 的 大 小 变 成 了 40KB。 因 此 ， 该 特定 文件 所 得 到 的 压缩 比 为 ，( 1 一 ( 语 5) ) x 100% =60%， 


在 推断 出 这 一 算法 是 否 总 是 (always) 可 以 产生 60% 的 文件 压缩 的 结论 之 前 ， 我 们 应 该 进行 大 量 的 统 
计 研 究 。 然而, 一旦 具备 了 少许 理论 背景 知识 后 ， 我 们 就 能 够 确定 某 种 压缩 算法 对 于 一 些 特定 的 信息 
或 信息 类 型 的 期 望 压缩 比 。 

数据 压缩 技术 的 研究 属于 信息 理论 (information theory) 这 个 更 大 的 研究 领域 内 的 一 个 分 支 。 信 
息 理论 是 研究 信息 存储 和 编码 方式 的 科学 。 这 种 理论 由 贝尔 (Bell) 实验 室 的 一 位 科学 家 Claude Shan- 
non 在 1940 年 创建 的 。Shannon 建立 了 很 多 信息 度量 的 方法 ， 其 中 最 基本 的 内 容 是 粹 (entropy， 或 称 
为 平均 信息 量 )。 婵 用 来 测量 一 个 消息 中 的 信息 量 。 具 有 和 较 高 焕 的 消息 比较 低 炉 的 消息 载 有 更 多 的 信 
息 。 这 种 定义 意味 着 一 个 载 有 较 低 信 息 量 的 消息 会 比 一 个 载 有 较 高 信息 量 的 消息 压缩 到 更 小 的 容量 。 

要 确定 一 个 信息 的 粹 ,首先 需要 确定 这 条 消息 中 每 个 符号 的 频繁 。 读 者 很 容易 按照 概率 来 思考 符 
号 频率 这 个 概念 。 例 如 ， 在 如 下 的 著名 程序 输出 诸 句 中 : 

HELLO WORLD! 

字母 上 出 现 的 频率 是 3/12 或 者 1/4。 使 用 符号 表示 ， 则 为 P(L) 一 0. 25。 为 了 将 该 概率 映射 为 某 
个 编码 字 中 的 二 进 制 位 ， 取 概率 以 2 为 底 的 的 对 数 (iog)。 这 里 ， 编 码 字 符 工 所 需要 的 最 小 位 数 为 ， 
一 logz P(L) =2 位 。 消 息 的 炉 是 在 该 消息 中 编码 每 个 符号 所 需要 的 二 进 制 位 数 的 加 权 平 均值 。 如 果 某 
个 符号 z 出 现在 一 个 消息 中 的 概率 为 P(z) ， 那 么 该 字符 xz 的 粹 日 为: 

H=— P(x) X logz P(x) 
整个 消息 的 平均 粮 则 是 对 消息 中 所 有 个 符号 出 现 的 概率 加 权 求 和 : 


> ) 一 PCzi) x logzP(zi) 
i=l 
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炳 为 编码 一 个 消息 所 需 的 二 进 制 位 数 建立 了 一 个 低 限 。 特 别 地 ， 如 果 将 整个 消息 的 字符 数 乘 以 加 
权 炉 值 ， 就 得 到 了 编码 一 个 消息 而 不 丢失 信息 所 需要 的 理论 上 的 最 少 二 进 制 位 数 。 除 了 这 个 低 限 外 的 
其 他 位 并 不 会 增加 信息 ， 因 此 这 些 位 是 元 余 的 (redundant)。 数 据 压 缩 的 目的 是 在 保留 原 有 信息 量 的 
同时 除去 宛 余 性 。 可 以 通过 下 面 的 公式 ， 对 包含 在 长 度 为 ! 的 编码 词 中 的 一 个 长 度 为 ”的 编码 消息 的 
每 个 字符 的 平均 元 余 量 进 行 量化 处 理 : 


Dj Pz) Xi— 2) — P(ri) XlogzP(zi) 
i=] 一 


当 对 某 个 给 定 的 消息 比较 各 种 编码 方案 的 有 效 性 时 ， 这 个 公式 非常 有 用 。 按 照 数 据 压 缩 的 观点 ， 
编码 一 个 消息 时 ， 具 有 最 少 元 余 量 的 编码 方案 是 比较 好 的 编码 方案 。 当 然 ， 我 们 还 必须 考虑 完成 编码 
的 速度 和 计算 的 复杂 性 ， 以 及 应 用 程序 的 细节 问题 ， 最 后 才能 确定 哪 种 方法 更 好 。 

上 式 的 一 个 直接 应 用 是 求 一 个 文本 消息 的 粹 和 元 余 。 如 果 使 用 一 个 定 长 的 编码 方式 ， 例 如 ASCII 
或 者 EDCDIC， 上 式 左边 的 求 和 就 是 编码 的 长 度 ， 通 常 为 8 位 。 在 HELLO WORLD! 的 例子 中 ， 通 过 
利用 上 式 右 边 的 求 和 ， 我 们 发 现 平 均 的 符号 炉 大 约 是 3.022。 这 意 昧 着 如 果 达 到 理论 上 的 最 大 粹 值 ， 
只 需 使 用 3. 022 位 /字符 X12 字符 = 36. 26 或 37 位 来 对 整 条 消息 进行 编码 。 因 此 ， 这 条 消息 的 8 位 
ASCII 编码 的 表示 形式 中 就 有 96 一 37 = 59 个 完 余 位 。 


7.8.1 统计 编码 


上 面 所 描述 的 粹 的 量度 方法 可 以 作为 设计 压缩 编码 的 基础 ， 利 用 统计 编码 方法 可 使 被 压缩 的 消息 
中 的 元 余 最 小 化 。 一 般 来 说 ， 采 用 统计 编码 的 压缩 过 程 相 对 较 慢 ， 而 且 与 I/O 过 程 密切 相关 。 在 消息 
被 压缩 和 写 人 存储 器 之 前 ， 系 统 需要 通读 文件 两 次 。 

要 求 通读 文件 两 次 的 原因 是 ， 第 一 次 对 文件 的 通读 只 是 用 来 计算 每 一 个 符号 出 现 的 次 数 。 计 数值 
将 用 来 计算 每 一 个 不 同 的 符号 在 源 消 息 中 出 现 的 概率 。 我 们 会 按照 所 计算 的 概率 对 源 消息 中 的 每 一 个 
符号 赋值 。 随 后 ， 最 新 的 赋值 会 与 编码 该 文件 所 需 的 一 些 信息 一 起 写 人 到 文件 中 。 如 果 这 个 被 编码 的 
文件 ， 连 同 编码 该 文件 所 需 的 赋值 表 ， 比 原来 的 文件 要 小 ， 我 们 就 说 发 生 了 数据 压缩 。 

赫 夫 曼 〈Huftman) 编码 和 算术 编码 是 两 种 基本 的 统计 数据 压缩 方法 。 在 大 量 流 行 的 压缩 程序 中 ， 
可 以 找到 这 两 种 方法 的 某 些 变 化 形式 。 首 先 从 赫 夫 曼 编 码 开始 ， 在 下 面 章节 中 将 检查 人 研究 这 两 种 方法 。 





假设 在 确定 了 源 消 息 中 每 个 符号 的 概率 后 ， 需 创建 一 个 可 变 长 度 的 编码 来 将 最 短 的 编码 字 分 配给 
使 用 频率 最 高 的 符号 。 如 果 这 个 编码 字 短 于 信息 字 ， 那 么 压缩 后 的 消息 结果 显然 也 会 比 信息 字 要 短 。 
摩尔 斯 (Morse) 编码 是 19 世纪 开始 出 现 的 编码 形式 ， 它 是 David A. Huffman 编码 的 其 中 一 种 形式 。 

摩尔 斯 编码 是 根据 英语 著作 中 各 个 字母 的 典型 使 用 频率 来 设计 的 。 从 图 7-27 中 可 以 看 出 ， 较 短 的 
编码 代表 了 英语 中 使 用 频率 较 高 的 字母 。 这 种 统计 的 字母 频率 显然 不 适用 于 单一 的 消息 。 一 个 著名 的 
例外 情况 是 “a telegram from Uncle Zachary vacationing in Zanzibar, requesting a few quid so he can 
quaff a quart of quinine!1” 央 此 ， 这 种 最 准确 的 统计 模型 对 每 条 消息 来 说 都 需要 个 别 地 加 以 考虑 。 为 了 . 
准确 分 配 各 个 编码 字 ， 替 夫 曼 算法 会 利用 从 源 消 息 中 求 出 的 符号 概率 来 构建 一 个 二 进 制 树 形 网 络 。 树 
的 遍历 给 出 了 消息 中 每 个 符号 的 位 图 〈 位 组 合 模式 ) 分 配 形式 。 我 们 用 一 个 简单 的 童谣 来 说 明 这 一 处 
理 过 程 。 为 了 更 清楚 ， 我 们 将 童谣 写成 如 下 没有 标点 符号 全 部 由 大 写字 母 组 成 的 形式 。 

HIGGLETY PIGGLETY POP 

THE DOG HAS EATEN THE MOP 

THE PIGS IN A HURRY THE CATS IN A FLURRY 

HIGGLETY PIGGLETY POP 

我 们 把 童谣 中 每 个 字符 出 现 的 次 数 写成 表格 形式 。 并 且 使 用 缩写 符号 二 ws> (空白 ) 来 表示 单词 
间 的 空格 字符 和 换行 字符 。( 参 见 表 7-1) 
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表 7-1 字母 出 现 的 频率 








图 7-27 摩尔 斯 国际 编码 





这 些 字母 出 现 的 频率 利用 树 的 两 个 节点 与 每 个 字母 关联 。 这 些 树 的 集合 〈 称 为 森林 ，forest) 按照 
字母 频率 的 循序 排列 成 如 下 的 直线 形式 : 


90060068 


下 面 通过 将 两 个 频率 最 小 的 节点 连接 起 来 ， 开 始 构建 二 进 制 树 。 因 为 最 小 频率 的 节点 有 4 个， 所 
以 可 以 任意 选择 最 左 端的 两 个 节点 。 这 两 个 节点 的 组 合 频率 和 为 2。 接着， 创建 一 个 标记 该 频率 和 的 
母 节点 ， 并 且 将 它 放 回 到 森林 中 ， 对 应 于 母 节点 标记 所 决定 的 位 置 ， 如 下 图 所 示 : 


09066 


对 最 小 频率 节点 重复 上 面 的 过 程 ， 如 下 图 所 示 : 











这 两 个 最 小 节点 是 F、M、C、 D 的 母 节点 。 将 它们 放 在 一 起 ， 相 加 的 频率 和 为 4， 属 于 从 左边 开 
始 的 第 4 个 位 置 ， 如 下 图 所 示 : 





最 左 端 两 个 节点 的 频率 相 加 等 于 5， 于 是 要 将 它们 移 到 树 中 间 的 新 位 置 上 ， 如 下 图 所 示 
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现在 两 个 最 小 的 节点 的 频率 相 加 等 于 7。 于 是 又 要 创建 一 个 新 的 母 节点 ， 并 将 这 个 子 树 移 到 森林 
中 间 与 其 他 频率 为 7 的 节点 放 在 一 起 ， 如 下 图 所 示 : 





经 过 多 次 的 全 加 过 程 ， 最 后 树 的 形状 如 下 图 所 示 : 
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该 树 构建 了 一 个 框架 ， 由 此 可 以 给 消息 中 的 每 个 符号 分 配 一 个 赫 夫 曼 编码 值 。 利 用 二 进 制 数 1 来 
标记 二 又 树 中 每 二 条 右 分 支 ， 而 二 叉 树 每 一 条 左 分 支 则 标记 为 0。。 其 结果 如 下 图 所 示 删除 了 频率 节 
点 会 使 图 看 起 来 更 加 清楚 ) 。 





© OW (OO 
现在 我 们 所 要 做 的 事情 就 是 从 树 根 节点 出 发 遍历 每 一 个 表 7-2 编码 方案 


叶 节 点 ， 并 记录 下 沿途 所 遇 到 的 二 进 制 数字 。 这 样 ， 所 完成 
的 编码 方案 如 表 7-2 所 示 。 

正如 我 们 所 看 到 的 一 样 ， 频 率 最 高 的 符号 在 编码 中 占用 
最 少 的 位 。 这 个 消息 的 平均 炉 大 约 为 3. 82 位 /符号 。 对 这 个 
信息 进行 压缩 的 低 限 位 数 为 110 符号 X3. 82 位 =421 位 。 赫 
夫 曼 编码 对 这 个 消息 实际 给 出 的 编码 数 是 426 位 ， 或 者 说 比 
理论 上 所 需要 的 最 少 位 数 大 约 多 出 了 1%。 
算术 编码 
从 理论 上 来 说 ， 赫 夫 曼 编码 通常 不 能 实现 最 佳 压缩 ， 这 
是 因为 赫 夫 曼 编码 在 结果 编码 中 受到 限制 需要 使 用 整数 位 
数 。 在 上 节 介 绍 的 童谣 中 ,符号 S 的 平均 粹 近似 等 于 1. 58。 
一 个 最 佳 的 代码 会 使 用 1. 58 位 对 每 次 出 现 的 符号 S 进行 编 
码 。 因 此 ， 如 果 采 用 赫 夫 曼 编 码 方法 ， 最 少 要 使 用 2 位 二 进 制 位 进行 编码 。 这 种 精度 上 的 欠缺 使 得 最 
后 的 结果 多 出 了 5 个 宛 余 位 。 当 然 ， 这 种 情况 还 不 算 太 坏 ， 但 是 看 起 来 我 们 还 可 以 做 得 更 好 一 些 。 

赫 夫 曼 编码 不 能 达到 最 佳 的 编码 效果 是 因为 它 所 采用 的 概率 映射 方式 ， 也 就 是 说 赫 夫 曼 编码 要 将 
实数 集 的 元 素 映射 为 整数 子 集中 的 元 素 。 正 因为 如 此 ， 我 们 肯定 会 遇 到 上 面 的 问题 ! 那么 ,为 什么 不 
能 设计 某 种 实数 对 实数 的 映射 形式 来 实现 数据 压缩 呢 ? 1963 年 ，Norman Abramson 就 设想 出 了 这 种 映 
射 方式 ， 随 后 由 Peter Elias 发 表 。 这 种 实数 对 实数 的 数据 压缩 方法 称 作 工 术 编 码 (arithmetic coding) 。 

从 概念 上 来 说 ， 算 未 编码 是 利用 消息 中 符号 集 的 概率 在 0 和 1 之 间 分 割 实数 轴 。 使 用 越 频 繁 的 符 
号 ， 分 割 所 得 到 的 区 间 块 就 越 大 。 

返回 大 家 喜爱 的 程序 输出 问题 ，HELLO WORLD1! 不 难看 出 ， 这 个 祈 使 语句 中 共有 12 个 字符 。 


在 这 些 符号 中 ,出现 最 低 的 概率 是 十 。 而 所 有 其 他 的 概率 都 是 二 的 整数 倍 。 因 此 ， 可 将 0 和 1 之 间 的 












110100 
110101 
1000100 










1000101 





-二 





1000110 
1000111 











区 间 划 分 为 12 个 部 分 。 除 了 工 和 O 外 ， 其 他 每 个 符号 都 分 配 得 到 了 证 的 区 间 。 符号 L 和 0O 则 分 别 获 


得 了 志和 广 的 区 间 。 概 率 和 区 间 之 间 的 映射 关系 如 表 7-3 所 示 。 
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表 7-3 对 于 HELLO WORLD'1 概率 与 区 间 的 映射 关系 
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[0. 750...0.833) 






[0. 833...0.917) 


通过 连续 地 划分 与 符号 所 分 配 区 间 成 比例 的 数值 范围 (从 0. 0 开始 到 1. 0 结束 ) 来 对 消息 进行 编 
码 。 例 如 ， 假 如 当前 的 区 间 位 置 是 二 ， 而 字母 上 获得 了 二 的 当前 区 间 ， 如 上 面 表 7-3 所 示 。 接 下 来 ， 


对 符号 L 进行 编码 ， 将 言 乘 以 十 得 到 字符 工 的 新 的 当前 区 间 击 。 如 果 下 一 个 字符 是 另外 一 个 字母 上 ， 


那么 将 各 再 乘 以 1/4 又 可 以 得 到 当前 的 区 间 值 为 11 。 这 个 编码 过 程 一 直 会 持续 下 去 ， 直 到 整 条 消息 编 
码 的 完成 。 在 学 习 了 下 面 的 伪 代 码 后 ， 这 个 编码 过 程 就 会 变 得 非常 清楚 。 有 关 输 出 HELLO WORLDI 


的 伪 代 码 的 详细 描述 如 图 7-28 所 示 。 
ALGORITHM Arith Code (Message) 
HiVal 人 二 1.0 /* Upper limit of interval. 
LoVal ¢- 0.0 /* Lower limit of interval. 


WHILE (more characters to process) 
Char ¢- Next message character 
Interval ¢€- HiVal - LoVal 
CharHiVal ¢- Upper interval limit for Char 
CharLoVal <= Lower interval limit for Char 
HiVal ¢- LoVal + Interval * CharHiVal 
LoVal - LoVal + Interval * CharLoVal 

ENDWHILE 

OUTPUT (LoVal) 

END Arith_Code 


.667 


0.917 


7-28 利用 算术 编码 方法 对 HELLO WORLD'1 进行 编码 


We 
ek 
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利用 这 一 编码 过 程 的 反 过 程 可 以 对 消息 进行 译 码 ， 下 面 给 出 了 译 码 过 程 的 伪 代 码 。 而 图 7-29 给 出 
的 是 上 述 伪 代 码 的 跟踪 过 程 。 


ALGORITHM Arith Decode (CodedMsg) 
Finished 人 一 FALSE 
WHILE NOT Finished 
FoundChar ¢- FALSE /* We could do this search much more “/ 
WHILE NOT FoundChar /* efficiently in a real implementation. */ 
PossibleChar ¢- next Symbol from the code table 
CharHiVal ¢- Upper interval limit for PossibleChar 
CharLoVal ¢- Lower interval limit for PossibleChar 
IF CodedMsg《 CharHiVal AND CodedMsg > CharLoVal THEN 
FoundChar ¢€ TRUE 
ENDIF / * We now have a character whose interval */ 
ENDWHILE /* surrounds the current message value. * 
OUTPUT(Matching Char) 
Interval ¢- CharHiVal - CharLoVal 
CodedMsgInterval ¢- CodedMsg - CharLoVal 
CodedMsg <*— CodedMsgInterval / Interval 
IF CodedMsg = 0.0 THEN 
Finished ¢- TRUE 
ENDIF 
END WHILE 
END Arith_ Decode 





图 7-29 HELLO WORLD! 解码 的 跟踪 过 程 


大 家 可 能 已 经 注意 到 算术 编码 /解码 算法 都 不 包括 任何 一 种 类 型 的 错误 检测 。 之 所 以 这 样 做 ， 是 
为 了 更 加 清楚 地 描述 问题 。 真正 实现 算术 编码 时 ， 不 但 要 保证 在 编码 结果 中 有 足够 的 位 数 来 满足 箭 
(信息 量 ) 的 要 求 ， 而 且 要 防止 浮 点 数 下 溢 的 情况 发 生 。 

当 对 消息 进行 解码 时 ， 浮 点 数 表示 法 的 差异 也 可 能 引起 算术 编码 算法 丢失 0 的 情况 发 生 。 事 实 
上 ， 在 编码 过 程 中 总 是 会 在 消息 的 尾部 插入 一 个 终止 消息 字符 ， 这 样 可 以 防止 在 解码 时 出 现 丢失 0 
的 情况 。 
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7.8.2 Ziv-Lempel (LZ) 字典 系统 


尽管 算术 编码 方法 可 以 获得 几乎 最 佳 的 数据 压缩 ， 但 是 它 的 速度 甚至 比 薪 夫 曼 编码 方法 更 慢 。 
这 是 因为 在 编码 和 译 码 的 过 程 中 ， 算 术 编 码 方法 必须 要 执行 浮 点 操作 。 如 果 速 度 是 我 们 首要 关心 的 
问题 ， 那 么 我 们 可 能 希望 考虑 其 他 的 压缩 方法 ， 这 也 就 意味 着 我 们 不 可 能 获得 一 种 理想 的 编码 。 的 
确 ， 如 果 能 够 避免 对 输入 消息 进行 两 次 扫描 ， 那 么 就 可 以 获得 可 观 的 速度 。 这 就 是 下 面 要 介绍 的 字 
典 方法 。 

Jacob Ziv 和 Abraham Lempel 率先 推出 了 在 读 取 信息 和 写 人 编码 字 节 的 过 程 中 构建 一 部 字典 的 思 
想 。 基 于 字典 的 算法 的 输出 内 容 既 包含 文字 信息 ， 又 包含 指示 先前 已 经 存放 字典 中 的 信息 的 指针 。 如 
果 数 据 中 存在 大 量 的 局 部 宛 余 ， 例 如 一 长 串 的 空格 或 数字 0， 这 种 基于 字典 的 压缩 技术 的 效果 会 特别 
好 。 尽 管 我 们 称 之 为 LZ 字典 系统 ， 但 是 如 果 要 使 用 作者 的 全 名 ， 则 “Ziv-Lempel” 会 比 “Lempel- 
Ziv” 更 好 一 些 。 

Ziv 和 Lempel 在 1997 年 发 表 了 他 们 的 第 一 个 算法 ， 被 称 为 LZ77 压缩 算法 (LZ77 compression al- 
gorithm) 。L277 压缩 算法 采用 一 个 文本 窗口 和 一 个 前 视 (look ahead) 缓冲 器 。 前 视 缓冲 器 包含 需要 
编码 的 信息 内 容 。 文 本 窗口 则 作为 字典 。 如 果 前 视 缓冲 器 中 的 任意 字符 可 以 在 字典 中 找到 的 话 ， 那 么 
在 窗口 中 对 应 的 文本 内 容 的 位 置 和 长 度 都 会 被 写 到 算法 的 输出 中 。 如 果 在 字典 中 没有 找到 所 要 求 的 文 
本 内 容 ， 那 么 在 写 这 个 没有 编码 符号 时 会 设置 一 个 标志 ， 指 示 这 个 符号 应 该 被 作为 文字 。 

现在 有 许多 不 同类 型 的 L277 压缩 方法 , 但 是 所 有 的 L277 压缩 方法 都 是 基于 同一 种 思想 。 下 面 通 
过 一 个 例子 ， 使 用 另外 一 个 童谣 来 解释 这 一 基本 思想 。 为 了 清晰 起 见 ， 我 们 用 下 划 线 来 取代 童谣 中 的 
所 有 空格 。 

STAR _LIGHT _ STAR_ BRIGHT _ 

FIRST_ STAR _I_SEE_ TONIGHT _ 

I_WISH_I_MAY _I_WISH_I_ MIGHT_ 

GET _THE_ WISH _I_ WISH_ TONIGHT 

为 了 说 明 问 题 ， 我 们 将 使 用 32 字 节 的 文本 窗口 和 一 个 16 字 节 的 前 视 缓 冲 器 (实际 上 ， 这 两 个 领 
域 通 常 相隔 几 千 个 字 节 ) 。 首 先 将 上 面 的 文本 读 人 到 前 视 缓冲 器 中 。 但 是 文本 窗口 还 没有 任何 内 容 ， 现 
在 把 符号 S 放 进 文本 窗口 并 写 人 一 个 三 重 态 〈 三 元 字 节 ) 到 输出 : 

1. 文本 窗口 中 匹配 字符 相对 于 文本 的 偏 移 量 

2. 匹配 字符 串 的 长 度 

3. 前 视 缓冲 器 中 紧 跟 匹配 短语 后 面 的 第 一 个 符号 


字符 0 
v 





文本 窗口 前 视 缓冲 器 


| | STRAR_LIGHT_STRR_ 
00S 一 一 一 一 一 发 出 


在 上 例 中 ， 因 为 在 文本 窗口 没有 匹配 的 内 容 ， 所 以 偏 移 量 和 字符 串 的 长 度 都 是 0。 前 视 缓 冲 器 中 
的 下 一 个 字符 工 也 没有 相 匹配 的 内 容 ， 因 此 它 也 将 作为 一 个 索引 和 长 度 都 是 0 的 文字 写 人 。 


00S 00T 
继续 读 取 文 字 ， 直 到 前 视 缓冲 器 中 的 工作 为 第 一 个 字符 出 现 。 这 个 工 与 文本 窗口 中 位 置 1 上 的 工 


相 匹配 。 前 视 缓 冲 器 中 紧 跟 在 字符 工 后面 的 字符 是 一 个 下 划 线 ， 它 也 就 是 要 写 到 输出 的 三 重 态 中 的 第 
三 项 。 
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0,0,L O00 00,G 0.0.H 11， 
0,0,S 0,0,T 0,0,A 0.0,R 0.0， 





现在 ， 前 视 缓冲 器 向 前 移 位 了 两 个 字符 。 STAR _ 已 经 成 了 前 视 缓冲 器 的 开始 部 分 。 它 与 文本 窗 


口中 第 一 个 字符 位 置 (位 置 0) 相 丐 配 。 于 是 ， 我 们 写 下 0，5，B， 因 为 B 是 前 视 缓冲 器 中 紧 跟 在 
STAR _ 后 面 的 第 一 个 字符 。 


STAR_LIGHT_ STAR_ BRIGHT_FIR 
0.5.B 


0.0.L 0,0, 0,0.G 0.0H 14、 
0,0,S 0,0,T 0.0A 0,0,R 0.0， 


我 们 又 向 前 移 位 前 视 缓冲 器 中 的 六 个 字符 ， 然 后 查找 字符 R 的 匹配 。 在 文本 位 置 3 中 找到 了 一 个 
R, 又 写 下 3, 1, I。 


EraR LIGHT STAR B IGHT_FIRST_STA 
0,5,B 3.1: 


0.0L 0,0 00G 00.H 1.1A 
0.0,S 0,0,T 0,0,A 0.0R 0.0， 





现在 , GHT 成 了 前 视 缓 冲 器 的 开始 部 分 。 它 与 文本 中 从 第 7 个 位 置 开 始 的 4 个 字符 相 匹配 ， 我 们 
再 写 人 7，4，F。 


STAR_LIGHT STAR BRI GHT_FIRST STAR I 


0.5.B 3.1J 7,4,F 
0,0,L 004 0.0,G 0.0.H 1,1.A 
0.0.S 0.0T 0.0A 00R 0.0， 


再 经 过 几 次 这 种 重复 过 程 以 后 ， 文 本 窗口 几乎 全 满 了 ， 如 下 图 所 示 : 


STRAR_LIGHT STAR BRIGHT FIRST BTAR_I SEE TONIG| 


0.5.B 3,1 74.F 6.1R 0.2, 
0,0,L 0,0,1 0,0,G 0.0.H 1,1.A 
0.0.S 0,0,T 0,0,A 0.0R 00， 





在 匹配 了 STAR _ 和 文本 中 位 置 0 处 字符 串 后 , STAR _T 这 6 个 字符 就 会 被 移出 缓冲 器 ， 而 进入 
文本 窗口 。 为 了 能 够 容纳 全 部 的 这 6 个 字符 ， 在 处 理 完 STAR _ 后， 文本 窗口 必须 要 右 移 3 个 字符 。 


STAR LIGHT STAR BRIGHT FIRST_ BTAR_1 SEE _ TONIG 
0.5,[ 


0.5.B 3,11 7.4F 6.1.R 0.2， 
0.0.L 0.01 00.G 0.0,H 11A 
00,S 0.0T 00A 0,0.R 0.0， 


在 为 STAR _I 写 好 编码 ， 并 对 文本 窗口 进行 移 位 以 后 ，_ S 现在 处 于 缓冲 器 中 的 开始 位 置 。 这 些 
字符 与 文本 中 位 置 7 处 的 字符 串 匹 配 。 


R LIGHT STAR BRIGHT FIRST_ STAR I SEE_ TONIGHT I 


0.51 7,2,E 

0,5,B 311 7,4,F 6.1,R 0.2， 
0,0,L 0,0,1 0,0,G 0,0,H 1,1,A 
0,0,S 0,0,T 0,0,A 0,0,R 00， 
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按照 这 种 方式 继续 下 去 ， 最 终 可 以 到 达 文 本 的 结束 处 。 算 法 要 处 理 的 最 后 一 些 字符 是 IGHT 。 这 
些 字符 与 位 置 4 处 的 文本 内 容 匹 配 。 因 为 缓冲 器 中 的 IGHT 后 面 已 经 没有 了 其 他 的 字符 ， 所 以 最 后 写 
出 的 三 重 态 是 一 个 文件 字符 结束 的 标记 符号 ，<<EOF>。 


_I MIGHT GET THE WISH I WISH TON IGHT 


4,4,<EOF> 
41E 98W 44T 000 O00N 





0,0,S 0,0,T 00A 0,0,R 00， 


本 例 共有 36 个 三 重 态 被 写 到 输出 中 。 如 果 采 用 32 字 节 的 文本 窗口 ， 那 么 索引 只 需 5 位 就 可 以 指 
示 任 何 一 个 文本 字符 。 因 为 前 视 缓冲 器 的 宽度 是 16 字 节 ， 能 够 匹配 的 最 长 字符 串 也 是 16 字 节 ， 所 以 
最 多 需要 用 4 位 来 存储 这 个 字符 串 的 长 度 。 索 引 需 要 5 位 ， 字 符 串 长 度 需要 4 位 ， 每 个 ASCII 字符 要 
用 7 位 ， 而 每 个 三 重 态 要 求 16 位 或 2 字 节 。 这 个 童谣 包含 了 103 个 字符 ， 将 它们 存储 在 磁盘 上 需要 
103 个 未 压缩 的 字 节 。 而 存储 压缩 消息 却 只 要 求 72 个 字 节 ， 这 样 得 到 的 压缩 系数 为 (1 一 (5 ) ) x100 
一 30% 。 

我 们 可 以 合理 地 认为 ， 如 果 增 大 文本 窗口 ， 就 会 增加 在 文本 窗口 中 查找 与 前 视 缓冲 器 中 字符 相 匹 
配 的 可 能 性 。 例 如 ， 字 符 串 _ TONIGHT 出 现在 童谣 中 的 第 41 个 位 置 和 第 96 个 位 置 上 。 因 为 两 次 出 
现 字符 串 _ TONIGHT 之 间 的 间隔 有 48 个 字符 ， 如 果 使 用 一 个 32 个 字符 的 文本 窗口 ， 那 么 第 一 次 出 
现 的 字符 串 _ TONIGHT 就 不 可 能 作为 第 二 次 出 现 的 字符 串 _ TONIGHT 的 字典 条 目 。 如 果 将 文本 
窗口 扩大 到 64 字 节 ， 那 么 第 一 次 出 现 的 _ TONIGHT 就 可 以 对 第 二 次 出 现 的 _TONIGHT 进行 纺 
码 ， 并 且 只 会 增加 1 位 到 每 个 编码 的 三 重 态 中 。 然 而 ， 在 本 例 中 ， 一 个 扩展 为 64 字 节 的 文本 窗口 只 会 
在 输出 中 减少 两 个 三 重 态 ， 即 从 36 个 减少 到 34 个 。 因 为 这 个 扩大 的 文本 窗口 要 求 有 7 位 来 表示 索引 ， 
所 以 每 个 三 重 态 需 要 由 17 位 组 成 。 这 样 ， 这 条 被 压缩 的 讯息 总 共 占 用 了 17X34= 578 位 或 73 个 字 节 。 
因此 ， 本 例 中 使 用 这 个 较 大 的 文本 窗口 ， 实 际 上 多 用 了 几 个 位 。 

在 压缩 的 过 程 中 ， 如 果 在 文本 窗口 和 缓冲 器 之 间 没 有 找到 任何 匹配 ， 那 么 就 会 有 简 并 的 情况 发 生 。 
例如 ， 如 果 有 一 个 36 字符 的 字符 串 ， 它 由 26 个 英文 字母 和 0 到 9 的 数字 组 成 ， 即 ABC. . . XY012. . . 89， 
在 这 里 没有 可 以 匹配 的 字符 。 因 此 ， 压 缩 算法 的 输出 将 会 是 36 个 (0，0,?) 形式 的 三 重 态 。 最 后 ， 将 
以 一 个 原 字 符 捉 长 度 的 输出 三 重 态 结束 ,或 者 说 压缩 长 度 扩 大 (expansion) 了 200%。 

幸运 的 是 ， 在 实际 中 很 少 发 生 像 刚才 引用 的 这 种 例外 情况 。 在 许多 流行 的 压缩 工具 中 ，LZ77 压缩 
方法 有 各 种 变化 形式 ， 包 括 用 途 比 较 广 的 PKZIP 方法 。IBM's RAMAC RVA 2 涡轮 式 磁盘 阵列 直接 在 
磁盘 控制 电路 中 实现 LZ77 压缩 方法 。 这 种 压缩 过 程 以 硬件 的 速度 进行 ， 而 且 对 用 户 来 说 是 完全 透明 
的 。 

自从 Ziv 和 Lempel 在 1977 年 发 表 了 他 们 的 算法 以 来 ， 基 于 字典 的 压缩 方法 一 直 是 非常 活跃 的 -- 
个 研究 领域 。 一 年 以 后 ， 当 他 们 发 布 他 们 的 第 二 个 基于 字典 的 压缩 算法 时 ，Ziv 和 Lempel 对 他 们 原来 
的 工作 做 了 很 大 的 改进 ， 第 二 种 基于 字典 的 压缩 算法 就 被 称 为 LZ78。LZ78 与 L277 不 同 ， 它 取消 了 原 
来 固定 大 小 的 文本 窗口 的 限制 。 相 反 ，LZ78 创造 了 一 种 被 称 为 trie 的 特殊 的 树 型 数据 结构 。 在 从 输入 
读 取 数据 时 ，LZ78 会 采用 一 些 标记 符号 来 填充 这 种 树 形 结构 。 如 果 有 需要 ， 这 种 树 的 每 个 内 部 节点 都 
有 多 个 子 节点 。 与 L277 压缩 方法 不 同 ，LZ78 并 不 是 将 字符 写 和 磁盘， 而 是 把 指针 写 人 到 树 型 结构 的 
各 个 标记 符号 中 。 在 完成 消息 的 编码 后 ，LZ78 会 将 整个 trie 写 人 磁盘 ， 而 且 在 对 该 消息 进行 译 码 前 首 
先 要 读 取 这 棵 树 。 有 关 trie 的 更 多 的 信息 可 以 参阅 附录 A。 


7. 8.3 GIF 和 PNG 压缩 


实现 LZ78 数据 压缩 所 面临 的 最 大 问题 是 如 何 对 trie 的 标记 符号 进行 有 效 的 管理 。 如 果 字 典 太 大 ， 
所 需要 的 指针 数目 就 可 能 变 得 比 原始 数据 还 要 多 。 现 在 已 经 找到 了 解决 这 个 问题 的 许多 方法 ， 其 中 的 
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一 种 方法 还 引起 了 激烈 争论 和 法 律 问题 。 

1984 年 ，Sperry 计算 机 公司 〈 现 在 称 为 Unisys) 的 一 名 雇员 Terry Welsh 发 表 了 一 篇 论文 ， 论 文 
描述 了 一 种 管理 LZ78 字典 的 有 效 算 法 。 这 种 解决 方案 主要 涉及 对 trie 中 所 使 用 的 标记 符号 的 大 小 进行 
有 效 控制 ， 称 为 LZW (Lempel-Ziv-Welsh data compression) 数据 压缩 。LZW 压缩 是 支持 图 形 交 换 格 
式 《Graphics Interchange Format) GIF (发 音 为 “jiff”) 的 一 种 基本 算法 , GIF 是 CompuServe 公司 的 
工程 师 们 开发 出 来 的 ， 并 且 由 www 网 推广 普及 。 因 为 Welsh 发 明 的 算法 是 属于 他 在 Sperry 公司 的 工 
作 职 责 的 一 部 分 ， 所 以 Unisys 公司 行使 其 权力 为 这 个 算法 申请 了 专利 。 随 后 ，Unisys 公司 就 要 求 对 每 
次 使 用 GIF 的 网 络 服务 的 提供 商 或 者 广大 的 用 户 都 收取 少量 的 专利 使 用 费 。LZW 不 是 专门 为 GIF 设 
计 的 ，LZW 同样 也 可 以 用 于 TIFF 图 形 格 式 和 其 他 的 一 些 压缩 程序 (包括 Unix Compress) 以 及 各 种 
类 型 的 软件 应 用 程序 (例如 Postscript 和 PDF) 和 某 些 硬件 设备 〈 其 中 最 有 名 的 设备 就 是 调制 解 调 器 ， 
Modem) 中 。 所 以 ，Unisys 公司 在 web 社区 内 没有 很 好 地 收 到 他 们 所 要 求 的 专利 使 用 费 ， 这 一 点 并 不 
会 邻 人 感到 意外 ， 因 为 一 些 网 站 公开 宣布 联合 起 来 永久 抵制 GIF 。Cooler 公司 率先 通过 创造 一 些 更 好 
(至 少 是 不 同 的 ) 的 算法 ， 已 经 巧妙 地 避 开 了 GIF 这 个 问题 。 其 中 一 种 算法 就 是 PNG， 可 移植 网 络 图 
形 格式 (Portable Network Graphics) 。 

如 果 只 是 有 关 GIF 专利 使 用 费 的 争论 并 不 会 导致 PNG (发 音 为 “ping”) 的 出 现 ， 但 是 这 种 争论 
这 无 疑 加 速 了 PNG 的 开发 进程 。 在 1995 年 的 短 短 几 个 月 时 间 内 ，PNG 就 从 一 种 草案 变 成 了 大 家 所 接 
受 的 国际 标准 。 但 是 令 人 感到 惊讶 的 是 ， 到 2002 年 为 止 ，PNG 的 规范 只 有 两 个 较 低 级 别 的 版 本 。 

PNG 对 GIF 做 出 了 许多 方面 的 改进 ， 其 中 包括 : 

。 用 户 可 选择 的 压缩 模式 : 在 0 到 3 范围 内 的 “快速 压缩 ”或 者 “更 佳 压缩 ”。 

* 比 GIF 有 更 高 的 压缩 比 ， 通 常情 况 下 可 以 改善 压缩 比 5% 到 25%。 

。 提 供 一 个 32 位 的 CRC (ISO 33097ITU-142) 错误 检测 功能 。 

“在 顺序 显示 模式 中 具有 较 快 的 初始 化 显示 。 

。 一 个 公开 的 国际 标准 ， 可 以 免费 使 用 ， 并 且 得 到 了 www 协会 〈(W3C) 和 许多 其 他 的 组 织 和 商业 

机 构 的 支持 。 

PNG 采用 二 级 压缩 方式 首先， 使 用 赫 夫 曼 编 码 简 化 信息 。 然 后 ， 在 完成 赫 夫 曼 编码 后 青 利用 一 
个 32 字 节 的 文本 窗口 进行 L277 压缩 。 

GIF 具有 一 种 PNG 所 没有 的 功能 : GIF 能 够 支持 同一 个 文件 中 的 多 个 图 像 ， 这 样 可 以 产生 动画 效 
果 (虽然 比较 呆板 )。 为 了 克服 这 种 限制 ， 互连网 协会 提出 了 多 图 像 网 络 图 形 (Multiple-imagine Net- 
work Graphics， 或 MNG， 发 音 为 “ming”) 算法 。MNG 是 PNG 的 扩展 ， 它 允许 把 多 个 图 像 压 缩 到 一 
个 文件 中 。 这 些 文件 可 以 是 任意 类 型 的 文件 ， 比 如 可 以 是 灰 度 图 像 文 件 ， 真 彩色 图 像 文 件 ， 甚 至 是 
JPEG 文件 (参见 下 一 节 的 内 容 )。MNG 的 1.0 版 本 在 2001 年 1 月 发 布 ， 后 来 不 断 地 进行 了 修改 和 功 
能 方面 的 增强 。PNG 和 MNG 压缩 工具 在 因特网 上 都 可 以 免费 获取 (包括 源 代 码 )。 因 此 ， 我 们 可 以 
合理 地 认为 气 弃 GIF 压缩 方法 将 只 是 一 个 时 间 问 题 。 


7.8.4 JPEG 压缩 


在 我 们 欣赏 一 个 图 形 图 像 时 ， 例 如 打印 出 来 或 在 计算 机 屏幕 上 显示 的 一 张 照片 ， 真 正 看 到 的 是 许 
多 像素 pixel， 或 picture element) 的 圆 点 组 成 的 集合 。 这 些 像 素 点 在 图 像 质量 差 的 介质 ， 例 如 报纸 
或 连环 画 中 ， 看 起 来 特别 的 明显 。 当 像素 点 很 小 ， 而 且 紧 密 育 集 在 一 起 时 ， 我 们 的 眼睛 就 会 感觉 到 一 
个 高 品质 的 图 像 。 作 为 一 种 主观 的 量度 标准 ,“ 高 品质 ”的 定义 是 从 大 约 300 像素 /英寸 (或 者 120 像 
素 / 厘 米 ) 开始 的 。 而 在 高 端 应 用 中 ， 大 多 数 人 都 同意 一 个 1600 像素 /英寸 (或 者 640 像素 /厘米 ) 的 
图 像 ， 如 果 不 能 被 认为 是 一 幅 最 佳 的 图 像 ， 也 应 该 是 一 幅 好 图 像 。 

像素 包含 图 像 的 二 进 制 编码 ， 显 示 器 和 打印 机 的 硬件 能 够 对 这 种 形式 的 编码 进行 译 码 解释 。 可 以 
采用 任意 数目 的 二 进 制 位 对 图 形 的 像素 进行 编码 。 例 如 ， 如 果 我 们 要 画 一 幅 黑 白 的 素描 画 ， 那 么 可 以 





葵 入 / 葵 志 和 阁 角 系统 225 





采用 每 个 像素 占用 一 位 的 编码 方式 。 这 个 像素 的 位 要 么 是 黑色 的 (像素 =0)， 要 么 是 白色 的 (像素 = 
1)。 如 果 我 们 决定 要 画 一 个 有 灰 度 的 图 像 ， 那 就 需要 考虑 采用 多 少 种 色调 的 灰 度 才能 满足 图 像 的 要 求 。 
如 果 要 求 8 种 色调 的 灰 度 ， 那 么 每 个 像素 就 需要 使 用 3 个 二 进 制 位 。000 代表 黑色 ，111 代表 白色 。 在 
000 和 111 之 间 的 任何 数 都 代表 某 种 色调 的 灰 度 等 级 。 

彩色 像素 是 由 红 、 绿 、 蓝 三 种 颜色 组 成 。 如 果 想 采用 8 种 不 同色 调 的 红色 、 绿 色 和 蓝 色 对 一 
像 着 色 ， 那么 每 种 颜色 成 份 〈each color component) 都 需要 使 用 3 位 二 进 制 数 。 因 此 ， 每 个 像素 就 需 
用 9 位 ， 可 以 产生 2 一 1 种 不 同 的 颜色 。 黑 色 仍 旧 采 用 全 0 来 表示 ， 即 ， R=000，G=000，B 一 000; 
白色 也 仍旧 采用 全 1 来 表示 ， 即 : R=111，G 一 111，B==111。“ 纯 ”绿色 为 R 二 000, G=111,， B= 
000; R= 二 011，G 二 000，B 二 101 则 给 出 了 某 种 色调 的 紫色 ; R= 二 111，G 二 111，B 二 000 就 产生 了 黄色 。 
每 种 颜色 所 使 用 的 位 数 越 多 ， 就 越 接 近 在 我 们 周围 所 看 到 的 “ 真 彩色 ”。 大 多 数 的 计算 机 系统 对 每 种 颜 
色 都 使 用 8 位 二 进 制 数 ， 可 以 表现 256 种 不 同 的 色调 ， 所 以 构建 的 色彩 都 近似 于 真 彩色 。24 位 的 像素 
可 以 显示 大 约 1600 万 种 不 同 的 颜色 。 

如 果 我 们 希望 以 某 种 方式 存储 一 个 4X6 英寸 (10X15 厘米 ) 的 照片 图 像 ， 并 且 希 望 在 以 后 打印 
或 预览 这 个 图 像 时 ， 可 以 获得 较 好 的 图 像 质量 。 如 果 按照 300 像素 /英寸 ， 每 个 像素 占用 24 位 (3 个 字 
节 ) 的 图 像 质量 ， 存 储 这 样 的 一 幅 图 像 就 需要 300 X 300 X6X4X3==6. 48MB 存储 空间 。 这 张 4X6 英 
寸 的 照片 可 能 只 是 张贴 在 网 络 上 的 某 个 销售 广告 的 一 部 分 内 容 。 可 以 想像 ， 如 果 一 些 使 用 调制 解 调 器 
拨号 上 网 的 客户 用 了 20 多 分 钟 的 时 间 还 没有 完成 广告 页 下 载 ， 那 么 我 们 将 很 可 能 会 失去 这 些 客户 。 如 
果 使 用 每 英寸 1600 像素 的 图 像 精度 ， 那 么 存储 空间 将 需要 近 1. 5GB， 这 意味 着 要 下 载 和 存储 这 些 图 像 
文件 实际 上 是 不 可 能 的 。 

JPEG 就 是 一 个 专门 设计 用 来 解决 这 个 问题 的 压缩 算法 。 值 得 庆幸 的 是 ， 一 般 照 片 图 像 包含 大 量 
的 元 余 信息 。 而 且 ， 某 些 理论 上 具有 高 业 值 (信息 量 ) 的 信息 常常 对 图 像 的 完整 性 并 不 重要 。 考 虑 到 
这 些 因素 ，ISO 和 ITU 专门 联合 组 成 了 一 个 图 像 专家 联合 组 〈joint Photographic Experts Group， 或 者 
简称 JPEG ， 读 音 为 “jay-peg”) 来 制定 一 个 国际 图 像 压缩 的 标准 。 第 一 个 JPEG 标准 ， 即 10928-1， 于 
1992 年 完成 发 布 。1997 年 开始 对 这 个 标准 进行 重大 修改 和 扩充 。 现 在 ， 新 的 标准 称 为 JPEG2000， 于 
2000 年 12 月 定稿 完成 。 

JPEG 是 一 组 算法 的 集合 ， 它 能 够 提供 极 好 的 压缩 效果 ， 其 代价 是 会 损失 一 些 图 像 信息 。 直 到 目 
前 为 止 ， 我 们 所 介绍 的 都 是 无 损失 的 数据 压缩 〈ijossless data compression) 。 经 过 压缩 后 存储 的 数据 与 
压缩 前 的 数据 是 完全 一 样 的 ， 除 非 由 于 计算 或 介质 错误 带 来 的 损失 。 有 时 ， 如 果 可 以 允许 少量 信息 损 
失 的 话 ， 那 么 可 以 实现 好 得 多 的 图 像 压 缩 效 果 。 照 相 图 像 特 别 适 合 于 有 损失 的 数据 压缩 〈lossy data 
compression)， 原 因 是 人 类 的 眼睛 具有 补偿 校正 图 形 图 像 中 出 现 少许 失真 的 能 力 。 当 然 ， 一些 图 像 携 
带 真 实 的 信息 ， 只 有 在 对 图 像 的 “质量 ”进行 仔细 的 界定 之 后 ， 才 可 以 对 图 像 进行 有 损失 的 数据 压缩 。 
医学 诊断 图 像 ， 例 如 X 光照 片 和 心电图 就 是 此 类 的 图 像 。 但 是 ， 家 庭 影 集 和 销售 小 册子 上 的 照片 ， 都 
是 一 些 允 许 损失 大 量 “ 人 信息” 的 图 像 。 即 使 这 些 信息 丢失 后 ， 人 们 仍旧 可 以 保留 它们 对 视觉 “质量 ” 
的 幻觉 。 

JPEG 最 突出 的 一 个 特点 就 是 ， 用 户 可 以 通过 在 压缩 图 像 之 前 提供 有 关 的 参数 来 控制 信息 损失 
的 数量 。 即 使 是 要 求 有 100% 的 图 像 保 真 度 ，JPEG 也 能 够 产生 非常 明显 的 压缩 效果 。 在 图 像 保 真 
度 为 75% 时 ，JEPG 压缩 过 程 所 损失 的 信息 几乎 是 难以 察觉 的 ， 而且 压缩 后 的 图 像 文件 尺寸 也 只 
有 原始 图 像 文件 大 小 的 一 小 部 分 。 图 7-30 展示 了 采用 不 同 的 质量 参数 压缩 一 个 灰 度 图 像 后 的 效果 
图 。 图 像 压缩 前 的 原始 文件 为 一 个 7. 14KB 大 小 的 位 图 ， 这 个 位 图 用 作 图 中 各 个 质量 参数 条 件 下 
的 输入 文件 。 

正如 大 家 所 看 到 的 ， 只 有 当 使 用 最 低 的 质量 因子 时 ，JPEG 压缩 所 造成 的 信息 损失 才 成 为 明显 的 
问题 。 大 家 同样 也 会 注意 到 ， 在 最 高 压缩 条 件 下 ， 图 像 会 呈现 类 似 于 纵横 拼 字 迷 的 模糊 外 观 。 如 果 理 
解 了 JPEG 的 工作 原理 ， 那 么 造成 上 面 这 种 情况 的 原因 就 会 变 得 非常 清楚 。 
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a.100%(5.33 KB) b.75%(1.96 KB) €.50%(1.49 KB) 





d.25%(1.11 KB) e.5%(639 B) f.1%(556 B) 
7-30 对 于 一 个 7. 14KB 的 位 图 文件 使 用 不 同 量化 的 JPEG 压缩 效果 
在 对 彩色 图 像 进行 压缩 时 ，JPEG 首先 要 将 RGB 的 成 分 转化 成 亮度 (luminance) 和 色 度 (chro- 
minance) 两 部 分 。 亮 度 是 色彩 的 明亮 程度 ， 而 色 度 是 色彩 本 身 的 鲜艳 程度 。 人 们 的 眼睛 对 色 度 没有 对 
亮度 人 敏感。 故此， 在 构建 结果 编码 时 ， 亮 度 部 分 在 随后 的 各 个 压缩 步骤 中 应 该 尽量 不 要 有 信息 于 失 ， 
而 灰 度 图 像 就 不 要 求 有 这 样 的 措施 。 
接 下 来 ， 将 图 像 划分 成 每 边 都 是 8 个 像素 的 许多 正方 形 块 。 然 后 ， 利 用 一 个 如 下 所 示 离 散 的 余弦 
变换 (DCT) ， 将 这 些 64 像素 方块 从 空间 域 (rz，y) 转换 到 频率 域 (zx，y): 


7 7 . . 
DCT(i,7)) = CO) x CG) >， Dy pixel(z,y) > os | x cos| | 
其 中 


1 
Hl 果 a 二 0 
co -二 or 


1 否则 

这 种 转换 的 输出 结果 是 一 个 8X8 整 型 矩阵 ， 变 化 范围 从 一 1024 到 1023。 其 中 ,位 于 i=0,， j=0 
处 的 像素 称 为 DC 系数 (DC coefficient) ， 而 且 这 个 系数 包含 一 个 原始 方块 中 的 64 像素 的 加 权 平 均值 。 
其 他 的 63 个 值 就 称 为 AC 系数 (AC coefficient)。 由 于 余弦 函数 的 特性 (cos0==1)， 变换 结果 的 频率 矩 
阵 ， 即 (i, 7) 和 矩阵 在 右 下 角 聚 集 的 是 一 些小 数 和 0。 而 大 数 集中 在 矩阵 左上 和 角 位 置 。 这 种 矩阵 的 模式 
非常 有 利于 多 种 不 同 的 压缩 方法 ， 但 是 目前 还 不 准备 介绍 这 些 内 容 。 

在 对 频率 矩阵 进行 压缩 之 前 ， 首 先 将 矩阵 中 的 每 个 值 除 以 一 个 量化 短 阵 〈quantization matrix) 中 
对 应 的 元 素 。 量 化 过 程 的 目的 是 把 11 位 的 DCT 输出 减少 到 一 个 8 位 值 。 在 JPEG 中 ， 这 个 步骤 会 造 
成 信息 损失 ， 这 种 损失 的 程度 可 以 由 用 户 选 择 。JPEG 规范 提供 了 几 个 量化 矩阵 ， 用 户 可 以 根据 自己 
的 判断 使 用 其 中 的 任何 一 个 矩阵 。 所 有 的 这 些 标准 和 矩阵 都 保证 频率 和 矩阵 中 的 元 素 包含 最 多 的 信息 ( 指 
朝向 左上 角 的 元 素 )， 而 且 保 证 在 量化 过 程 中 损失 尽 可 能 少 的 信息 量 。 

经 过 量化 步 又 后 ， 频 率 矩 阵 变 成 了 一 个 稀疏 (sparse) 和 矩阵， 该 矩阵 包含 0 的 元 素 要 多 于 非 0 的 元 
素 ， 这 些 0 元 素 都 位 于 抢 阵 的 右 于 角 。 因 此 ， 使 用 运行 长 度 编码 〈run-length coding) 方式 可 以 方便 地 
对 具有 相同 值 的 大 数据 块 进行 压缩 。 

运行 长 度 编码 是 一 种 非常 简单 的 压缩 方法 。 运 行 长 度 编码 不 是 采用 XXXXX 的 编码 方式 ， 而 是 编 
码 为 65，X) 7， 指示 出 运行 5 个 买 的 长 度 。 如 果 存 储 的 是 5，X) ， 而 不 是 XXXXX， 那 么 将 会 节省 3 
个 字 节 ， 但 是 并 不 包括 这 种 方法 可 能 要 求 的 任何 定 界 符 。 很 明显 ， 要 使 用 这 种 编码 最 有 效 的 方法 是 尽 
量 使 每 个 事件 都 对 齐 ， 以 便于 可 以 得 到 尽 可 能 多 的 相连 的 0。 通 过 对 频率 矩阵 进行 之 字形 (zig-zag) 扫 
描 完 成 了 JPEG 这 种 功能 。 这 个 扫描 步骤 的 结果 是 通常 包含 一 个 长 串 0 的 一 维 矩 阵 (矢量 ) 。 图 7-31 说 
明了 之 字形 扫描 的 工作 原理 。 


r=0 y=0 
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矩阵 输入 
区 | 矢量 输出 
E> [(0,0),(0,1),(1,0),(2,0),(1,1),...(6,7),(7,6),(7,7)] 


图 7-31 一 个 JPEG 频率 矩阵 的 之 字形 扫描 过 程 


使 用 运行 长 度 编码 方式 对 这 个 矢量 中 的 每 个 AC 系数 进行 压缩 。 如 果 有 DC 系数 ， 那 么 就 要 将 DC 
系数 编码 为 DC 系数 的 原始 值 和 前 面 方块 中 的 DC 系数 之 间 的 算术 差 。 

然后 ， 可 以 使 用 赫 夫 曼 编码 方法 或 者 算术 编码 方法 ， 对 运行 长 度 编码 后 的 矢量 结果 做 进一步 的 压 
缩 。 赫 夫 曼 编码 是 首选 的 方法 ， 因 为 算术 算法 有 大 量 的 专利 限制 。 

图 7-32 总 结 了 上 面 所 描述 的 JPEG 算法 的 各 个 步骤 。 显 然 ， 要 实现 解压 算法 只 需 将 压缩 过 程 的 各 
个 步 又 反 转 过 来 。 


~JONw 上 wb 一 口 ， 


压缩 后 的 
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图 7-32 JPEG 压缩 算法 

JPEG 2000 对 1997 年 颁布 的 JPEG 标准 做 了 许多 的 改进 。JPEG 2000 的 基础 算法 比 以 前 更 加 完善 
和 复杂 ， 而 且 在 量化 参数 和 将 多 个 图 像 合 并 到 同一 个 JPEG 文件 中 的 处 理 方面 具有 了 更 大 的 灵活 性 。 
JPEG 2000 最 显著 的 特点 之 一 是 允许 用 户 定 义 兴趣 区 域 (regions of interest) 。 兴 趣 区 域 就 是 图 像 中 某 
个 用 户 所 关注 的 重点 范围 ， 并 且 兴 趣 区 域内 的 图 像 不 会 受到 和 图 像 其 他 部 分 同等 程度 的 有 损 压 缩 。 例 
如 ， 假 设 我 们 拍摄 一 张 某 个 朋友 站 在 湖 边 的 照片 。 我 们 可 能 会 告诉 JPEG 2000， 照 片 中 的 这 个 朋友 才 
是 我 们 的 兴趣 区 域 。 因 此 ， 湖 的 背景 和 周围 的 树木 会 被 大 幅度 地 压缩 ， 而 损失 一 些 清晰 度 。 然 而 ， 这 
个 朋友 的 图 像 将 被 清晰 地 保留 下 来 。 这 样 一 来 ， 如 果 不 对 图 像 进行 增强 处 理 的 话 ， 图 像 的 背景 质量 会 
比较 差 。 

JPEG 2000 采用 了 一 个 小 波 变 换 来 代替 JPEG 中 的 离散 余弦 变换 。 小 波 变换 使 用 不 同 的 方式 对 图 
像 或 信号 进行 采样 和 编码 。JPEG 2000 的 量化 过 程 使 用 的 是 一 个 正弦 函数 ， 而 不 是 早期 版 本 中 所 采用 
的 简单 除法 。 这 些 更 加 复杂 的 算术 处 理 要 求 比 JPEG 占用 更 多 的 处 理 器 资源 ， 这 将 会 造成 计算 机 系统 
性 能 的 显著 下 降 。 在 解决 这 个 性 能 问题 之 前 ，JPEG 2000 只 适用 于 需要 特色 处 理 而 不 要 求 增加 计算 能 
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力 所 产 生 的 成 本 问题 的 地 方 。 换 言 之 ， 如 果 计 算 能 力 方 面 的 成 本 降低 已 经 变 得 与 迟缓 增加 的 计算 机 性 
能 无 关 时 ， 可 以 使 用 JPEG 2000。 


本 章 小 结 


本 章 比较 全 面 地 评述 了 有 关 计 算 机 输入 /输出 和 存储 系统 诸多 方面 的 内 容 。 读 者 可 以 了 解 不 同类 型 的 机 
器 需要 使 用 不 同 的 MO 结构 。 从 本 质 上 来 说 ， 大 型 计算 机 系统 中 存储 和 访问 数据 的 方式 与 小 型 计算 机 上 所 
使 用 的 方法 是 完全 不 同 的 。 

本 章 阑 述 了 如 何 将 数据 存储 到 各 种 不 同 的 介质 上 ， 例 如 磁带 、 磁 盘 和 光盘 等 。 如 果 理 解 了 磁盘 工作 的 
原理 ， 那 么 对 于 编程 、 系 统 设 计 或 者 是 故障 诊断 过 程 中 分 析 磁 盘 性 能 是 非常 有 帮助 的 。 

本 章 中 有 关 RAID 系统 的 讨论 ， 将 有 助 于 我 们 理解 RAID 是 如 何 来 改进 系统 的 性 能 和 增加 系统 的 可 用 
性 。 

同时 ， 读 者 也 学 习 了 几 种 数据 压缩 的 方法 。 数 据 压缩 可 以 帮助 我 们 节省 磁盘 空间 和 磁带 的 使 用 ， 并 且 还 
能 够 减少 数据 通信 时 的 传输 时 间 。 了 解 这 些 压 缩 方法 的 细节 过 程 可 以 帮助 我 们 为 特定 的 应 用 程序 选择 最 好 的 
压缩 方法 。 而 有 关 信 息 理 论 的 简要 介绍 则 是 为 我 们 今后 在 计算 机 科学 领域 的 进一步 学 习 做 一 些 准 备 工作 。 

本 章 希 望 通过 这 些 内 容 的 讨论 ， 读 者 可 以 在 做 出 任何 实际 的 系统 决定 前 ， 对 系统 的 性 能 有 一 个 综合 评 
价 。 读 者 可 以 看 到 ， 我 们 常常 需要 考虑 如 何在 “更 好 ”与 “更 快 ” 之 间 ， 和 “更 快 ” 与 “更 便宜 ”之 间 做 
出 适当 的 选择 。 如 果 作为 系统 项 目的 负责 人 ， 我 们 必须 确信 我 们 的 客户 也 能 够 和 我 们 一 样 地 理解 这 种 性 能 
之 间 的 权衡 关系 。 通 常 ， 我 们 需要 非常 有 策略 地 使 我 们 的 客户 完全 相信 世界 上 没有 这 样 免 费 的 午餐 。 


深入 阅读 


阅读 Amdahl (1967) 的 原始 文献 可 以 对 Amdah 定律 有 更 多 的 了 解 。Hennesey 和 Patterson (1996) 还 
给 出 了 有 关 Amdahl 定律 的 其 他 适用 范围 。 

Rosch 〈1997) 的 著作 中 包含 大 量 与 本 章 主题 相关 的 细节 内 容 ， 但 是 本 书 主 要 关心 的 还 是 小 型 计算 机 系 
统 。 本 书 的 内 容 组 织 得 很 好 ， 而 且 写 作风 格 清楚 易 读 。 

Rosch (1997) 的 著作 还 为 CD 存储 技术 做 了 一 个 很 好 的 概述 。 对 于 更 完整 的 内 容 介 绍 ， 包 括 CD- 
ROM”S 物 理 的 基础 ， 数 学 的 背景 和 电子 工程 方面 的 支撑 等 ， 可 以 阅读 Stan (1998) 和 Williams (1994) 
的 著作 。 

Patterson、Gibson 和 Katz 〈1988) 的 论文 是 有 关 RAID 结构 的 基础 性 的 文章 。 

到 目前 为 止 ，IBM 公司 设立 的 众多 网 站 是 提供 有 关 详 细 技 术 信 息 的 最 好 的 网 站 。IBM 公司 独自 在 网 络 
土 所 供 了 大 量 的 优秀 文献 以 方便 所 有 的 搜索 者 获取 。IBM 公司 的 主页 是 : www. ibm. com。 除 了 他 们 的 服务 
器 产品 热线 www. ibm, com/eservers 外 ，IBM 公司 还 设 有 许多 特殊 兴趣 领域 的 专门 网 站 ， 包 括 有 关 存 储 系 
统 的 网 站 www. storage. ibm. com。IBM 公司 的 研发 网 页 www. research. ibm. com， 包 含 大 量 与 新 技术 发 展 
相关 的 最 新 信息 。 高 质量 学 术 期 刊 可 以 通过 网 址 www. research. ibm. com/journal 查找 。 

关于 数据 压缩 方面 的 内 容 并 不 缺乏 优秀 的 著作 和 文献 。Lelewer 和 Hirschberg (1987) 论文 是 一 篇 经 常 
被 人 们 引用 的 理论 综述 。 在 Nelson 和 Gailly (1996) 著作 中 可 以 找到 一 种 更 加 详细 的 处 理 方法 ， 包括 源 代 
码 。Nelson 和 Gailly 他 们 那 种 清晰 明了 和 随意 的 写作 方式 ， 会 使 得 读者 学 习 神 秘 的 数据 压缩 艺术 的 过 程 变 
成 了 一 种 真正 愉快 的 经 历 。 也 可 以 在 网 上 查找 大 量 关于 数据 压缩 的 信息 。 只 要 查找 任何 一 个 本 章 中 引进 的 
有 关 数 据 压 缩 的 关键 项 目 ， 利 用 任意 一 个 好 搜索 引擎 都 可 以 找到 成 百 上 千 个 网 络 链接 。 

在 数据 压缩 和 数据 通信 领域， 小 波 (Wavelet) 理论 变 得 越 来 越 重 要 。 如 果 读 者 想 在 这 一 领域 钻研 发 展 
的 话 ， 可 以 从 阅读 Vetterli 和 Kovacevit (1995) 的 著作 开始 。 该 书 还 介绍 了 大 量 有 关 图 像 压 缩 方 面 的 内 
容 ， 当 然 包括 JPEG 和 JPEG 2000 中 应 用 的 小 波 理论 。 

在 本 章 结尾 处 的 特别 “专题 (Focus On)” 部 分 ， 讨 论 了 许多 MO 结构 ， 其 中 包括 光纤 信道 、SANS 和 
HIPPI 等 内 容 。 在 书籍 方面 ， 有 关 描 写 光纤 信道 或 SANS 的 著作 为 数 不 多 ， 较 难 找到 。Clark (1999) 和 
Thornburgh 〈1999) 的 著作 都 对 这 一 主题 进行 了 很 好 的 讨论 。 国 家 信息 技术 标准 委员 会 (NCITS 一 一 前 身 
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为 通用 标准 委员 会 X3 ， 信 息 技 术 ) 产业 协调 小 组 ， 设 立 了 一 个 综合 性 的 网 站 www. tl1. org。 在 这 个 网 站 上 
可 以 找到 最 新 的 SCSL3 标准 的 草稿 。 而 HIPPI 规范 可 以 在 网 站 www. hippi. org 上 找到 。 

Rosch (1997) 的 著作 中 还 包含 大 量 关 于 SCSI 与 其 他 总 线 结 构 的 信息 ， 以 及 如 何在 小 型 计算 机 系统 中 
实现 这 些 总 线 结构 。 
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基本 概念 和 术语 复习 


1. 用 文字 表述 Amdahl 定律 。 

2. 什么 是 加 速率 ? 

3. 什么 是 协议 ? 为 什么 协议 在 7O 总 线 技术 中 非常 重要 ? 
4. 列举 三 种 不 同类 型 的 持久 性 存储 器 。 
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5. 解释 程序 控制 的 1/O 与 中 断 控制 的 1/O 之 间 有 什么 不 同 。 
6. 什么 是 轮流 检测 (或 轮 询 法 )? 

7. 在 中 断 控 制 的 I/O 中 ， 如 何 使 用 地 址 向 量 ? 

8. 直接 存储 器 访问 (DMA) 的 工作 原理 是 什么 ? 

9. 什么 是 总 线 主 控 ? 

10. 为 什么 DMA 需要 周期 窃取 ? 

11. 当 有 人 将 VO 看 作为 突 发 式 ， 它 表示 的 是 什么 意思 ? 
12, 通道 控制 的 MO 与 中 断 控制 的 1/O 有 什么 不 同 ? 

13. 通道 控制 的 1/O 与 DMA 有 何 相似 之 处 ? 

14. 什么 是 多 路 复 用 技术 ? 

15. 同步 总 线 和 异步 总 线 的 区 别 是 什么 ? 

16. 什么 是 稳定 时 间 ， 对 稳定 时 间 可 以 做 些 什 么 ? 

17. 为 什么 磁盘 被 称 为 直接 存储 设备 ? 

18. 解释 磁盘 底板 、 磁 道 、 扇 区 和 区 块 之 间 的 关系 。 

19. 组 成 硬盘 驱动 器 的 主要 物理 部 件 有 哪些 ? 

20. 什么 是 分 区 位 记录 法 ? 

21. 什么 是 寻 道 时 间 ? 

22. 旋转 延 时 和 寻 道 时 间 的 总 和 叫做 什么 ? 

23. 什么 是 文件 分 配 表 (FAT)， 它 位 于 软盘 中 哪个 位 置 ? 
24. 硬盘 的 转速 比 软盘 的 转速 快 多 少 个 数量 级 ? 

25. 自动 光盘 库 设 备 的 名 称 是 什么 ? 

26. 直接 写 到 光学 介质 上 而 不 是 写 到 纸 带 或 微缩 胶片 上 的 计算 机 输出 首 字母 的 缩写 词 是 什么 ? 
27. 磁盘 通过 改变 磁盘 介质 的 磁极 性 来 存储 字 节 。 那 么 光盘 是 如 何 存储 字 节 的 呢 ? 
28. 存储 音乐 的 CD 格式 与 存储 数据 的 CD 格式 有 什么 不 同 ? 格式 之 间 有 什么 相似 之 处 ? 
29. 对 于 长 期 数据 的 存储 来 说 ， 为 什么 CD 特别 的 有 用 ? 

30. 存储 数据 的 CD 是 使 用 记录 时 间 方 式 吗 ? 

31. DVD 如 何 存储 比 CD 多 得 多 的 数据 ? 

32. 写 出 记录 WORM 磁盘 的 三 种 方法 ? 

33. 为 什么 磁带 是 一 种 非常 流行 的 存储 介质 ? 

34. 解释 蛇 形 线 式 记 录 和 螺旋 线 扫描 记录 有 什么 不 同 之 处 ? 
35. 使 用 蛇 形 线 式 记 录 的 两 种 流行 格式 是 什么 ? 

36. 哪 一 种 RAID 技术 能 够 提供 最 好 的 性 能 ? 

37. 哪 一 种 RAID 技术 最 经 济 ， 而 又 可 以 提供 足够 的 宛 余 量 ? 
38. 哪 一 种 RAID 技术 使 用 镜像 磁盘 组 ? 

39. 什么 是 混合 RAID 系统 ? 

40. 科学 信息 理论 的 葛 基 人 是 谁 ? 

41. 什么 是 信息 炉 ? 信息 炉 如 何 与 信息 元 余 相 关联 ? 

42, 说 明 统 计 编 码 的 优点 和 缺点 ? 

43, 列 出 两 种 统计 编码 的 类 型 。 

44. L277 压缩 算法 属于 哪 一 种 数据 压缩 算法 ? 


练习 题 


令 1. 你 的 朋友 刚 买 了 一 台新 的 个 人 计算 机 。 她 告诉 你 她 的 新 计算 机 系统 运行 速度 是 1GHZ， 这 是 否 意 味 着 她 
的 新 系统 的 速度 要 比 她 那 台 300MHz 的 老 机 器 要 快 3 倍 多 呢 ? 请 解释 原因 ? 
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2. 假定 一 台 计 算 机 的 日 常 工作 量 由 60%CPU 活动 率 和 40% 磁 盘活 动 率 所 组 成 。 客 户 正 在 抱怨 计算 机 系统 
太 慢 了 。 在 经 过 一 番 研 究 以 后 ， 你 发 现 可 以 用 8 000 美元 来 升级 磁盘 ， 升 级 后 的 磁盘 速度 比 目 前 正在 使 
用 的 磁盘 快 2.5 倍 。 同 样 。 也 可 以 用 5 000 美元 来 对 CPU 进行 升级 ， 升 级 后 CPU 的 速度 比 现 在 的 CPU 
快 1.4 倍 。 

a) 如 果 想 用 最 少 的 钱 ， 获 得 最 好 的 系统 性 能 改善 ， 你 会 选择 哪 一 种 方案 ? 

b) 如 果 你 并 不 在 乎 钱 的 因素 ， 只 要 求 系统 的 速度 更 快 些 ， 那 你 又 会 选择 哪 一 种 建议 呢 ? 

c) 对 于 上 述 的 系统 升级 ， 收 支 平衡 点 是 什么 ? 也 就 是 说 ， 对 于 CPU 升级 方案 (或 磁盘 ， 只 改变 其 中 之 
一 ) ， 什 么 样 的 价格 可 以 使 得 对 于 这 二 者 1% 的 增长 ， 最 后 的 成 本 是 相同 的 ? 

令 3. 在 第 2 题 中 ， 如 果 系 统 的 活动 率 变 为 由 55% 的 处 理 器 时 间 和 45 闻 的 磁盘 活动 所 组 成 ， 那 么 上 面 问 题 的 
答案 又 是 什么 ? 

4. 写 出 4 种 类 型 的 1/O 结构 。 并 说 明 这 些 结构 通常 情况 下 在 什么 地 方 使 用 ? 为 什么 ? 

5. 一 个 带 有 中 断 控 制 的 1/O 的 CPU 正在 忙于 服务 某 个 磁盘 请 求 。 如 果 CPU 正在 执行 磁盘 服务 例 行 程序 的 
中 途 ， 此 时 又 有 另外 一 个 VO 中 断 将 要 发 生 。 请 问 
令 a) 接 下 来 会 发 生 什么 情况 ? 

令 b) 这 是 一 个 问题 吗 ? 

令 c) 如 果 不 是 一 个 问题 ， 为 什么 ?如 果 是 一 个 问题 ， 那 么 应 该 做 些 什么 ? 

6. 为 什么 要 为 IO 总 线 提供 时 钟 信号 ? 

7. 如 果 需 要 使 用 一 条 地 址 总 线 能 够 对 8 台 设 备 进行 编 址 ， 那 么 需要 多 少 根 导 线 ? 如 果 每 一 台 设 备 都 要 求 能 
够 对 1/O 控制 设备 做 出 应 答 ， 那 又 会 是 什么 情况 ? 

8. 本 章 我 们 曾 指出 I/O 总 线 并 不 一 定 要 求 有 独立 的 地 址 总 线 。 画 出 一 个 类 似 于 图 7-7 时 序 图 ， 对 于 一 个 写 
操作 描述 在 W/O 控制 器 和 磁盘 控制 器 之 间 的 握手 协议 过 程 〈 提 示 : 需要 增加 一 个 控制 信号 ) 。 

x 9. 如 果 图 7-7 中 所 显示 的 时 间 间 隔 为 50 纳 秒 ， 那 么 传输 10 个 字 节 的 数据 需要 多 长 时 间 ? 请 构思 设计 一 
个 总 线 协 议 ， 可 以 减少 上 面 的 传输 过 程 发 生 所 需要 的 时 间 ， 控 制 线 的 数目 可 以 根据 需要 而 定 。 如 果 去 
掉 地 址 线 ， 而 是 使 用 数据 线 来 代替 地 址 线 ， 那 又 会 发 生 什么 样 的 情况 ? (提示; 需要 一 个 附加 的 控制 
线 。) 

10. 写 出 寻 道 时 间 、 旋 转 延 时 和 传输 时 间 的 定义 。 并 解释 它们 之 间 的 相互 关系 。 

令 11. 你 认为 将 磁盘 驱动 器 说 成 随机 访问 设备 是 用 词 不 当 吗 ? 为什么? 

12. 为 什么 不 同 的 系统 要 把 磁盘 目录 放置 在 磁盘 上 不 同 的 磁道 位 置 ? 说 明 使 用 各 自 的 目录 区 域 有 什么 优点 ? 

争 13. 验证 图 7-11 的 磁盘 规范 中 的 平均 反应 速率 。 在 这 个 计算 中 为 什么 要 除 以 2? 

14. 通过 仔细 检查 图 7-11 中 的 磁盘 规范 ， 你 认为 这 个 磁盘 驱动 器 是 否 使 用 分 区 位 记录 方式 ? 

15. 图 7-11 的 磁盘 规范 中 给 出 了 从 磁盘 读 取 数据 时 的 数据 传输 率 为 6.0MB， 而 向 磁盘 写 人 数据 时 的 数据 传 
输 率 为 11. 1MB。 为 什么 这 两 个 数据 会 产生 不 同 ? 

16. 你 是 否 相信 磁盘 驱动 器 的 MTRR 数字 ? 请 解释 原因 。 

17. 假定 磁盘 驱动 器 具有 如 王 特 性， 

。 有 4 个 记录 面 

。 每 个 面 有 1 024 个 磁道 

。 每 个 磁道 有 128 个 扁 区 

。512 字 节 / 肩 区 ， 

。 磁 道 对 磁道 的 寻 道 时 间 为 5 毫秒 
。 旋 转速 率 为 5 000RPM 

多 a) 驱动 器 的 容量 是 多 少 ? 

合 b) 访问 时 间 是 多 少 ? 

18. 假定 磁盘 驱动 器 具有 如 下 特性 : 
。5 个 记录 面 
。 每 个 面 有 1 024 个 磁道 
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。 每 个 磁道 有 256 个 扇 区 

。512 字 节 / 扇 区 

。 磁 道 对 磁道 的 寻 道 时 间 为 8 毫秒 

。 旋 转速 率 为 7 500RPM 

a) 磁盘 驱动 器 的 容量 是 多 少 ? 

b)》 访问 时 间 是 多 少 ? 

c) 这 个 磁盘 是 否 要 比 第 17 题 中 描述 的 磁盘 快 ? 请 解释 原因 。 

每 个 磁盘 区 块 只 有 少量 扇 区 的 优点 和 缺点 分 别 是 什么 ? 

给 出 几 种 改进 1. 44MB 软盘 性 能 方法 的 建议 。 

在 一 张 1. 44MB 软盘 上 ， 能 容纳 的 最 大 根 目录 条 目的 数目 是 多 少 ? 为 什么 ? 

光盘 的 组 织 结构 与 磁盘 的 组 织 结 构 有 哪些 方面 的 不 同 ? 

讨论 DLT 和 DAT 记录 数据 方式 之 间 的 区 别 。 并 说 明 为 什么 你 会 认为 其 中 一 种 方式 比 另 一 种 更 好 些 ? 
光学 文档 存储 系统 的 纠 错 要 求 与 以 文本 形式 存储 相同 信息 的 纠 错 要 求 有 什么 不 同 ? 对 于 光学 存储 设备 
来 说 ， 使 用 不 同 的 纠 错 级 别 有 何 优点 ? 

如 果 需 要 存档 大 量 的 数据 ， 你 正在 决定 是 要 使 用 磁带 存储 方法 还 是 光学 存储 方法 。 这 种 数据 有 什么 特 
性 ? 并 说 明 为 什么 会 做 出 这 样 的 选择 ? 

某 Web 电子 商务 服务 器 使 用 了 一 台 特 殊 的 高 性 能 计算 机 系统 。 这 台 系 统 每 小 时 可 以 完成 总 共 10 000 美 
元 的 交易 量 。 估 计 的 纯利 润 是 每 小 时 1 200 美元 。 换 句 话说 ， 如 果 系 统 崩 涡 了 ， 那 么 该 公司 每 小 时 将 损 
失 1 200 美元 ， 直 到 系统 修复 为 止 。 而 且 ,， 已 经 损坏 的 磁盘 上 的 任何 数据 都 会 丢失 。 其 中 有 些 数据 可 以 
在 昨 晚 备份 的 数据 中 重新 找到 ， 而 其 余 的 数据 将 会 永远 地 丢失 。 可 以 想像 ， 一 个 难以 控制 的 磁盘 损坏 
可 能 导致 公司 几 十 万 美元 的 直接 收入 损失 ， 以 及 数 不 清 的 永久 性 商业 损失 。 事 实 上 ， 困 扰 你 的 问题 是 
这 个 系统 目前 没有 使 用 任何 类 型 的 RAID 系统 。 

也 许 你 主要 关心 的 问题 是 数据 完整 性 和 系统 的 可 用 性 ， 然 而 小 组 中 的 其 他 一 些 成 员 可 能 更 关注 系 
统 的 性 能 。 他 们 觉得 如 果 安 装 了 RAID， 系 统 的 速度 变 慢 ， 从 长 远 的 观点 来 看 ， 可 能 会 造成 更 多 的 收入 
损失 。 他 们 特别 指出 ， 如 果 带 有 RAID 的 系统 的 运行 速度 只 有 当前 系统 的 一 半 ， 将 会 导致 每 小 时 的 总 
收入 下 降 到 只 有 每 小 时 5 000 美元 。 

80% 的 系统 电子 商务 活动 会 涉及 到 数据 库 的 事务 处 理 。 数 据 库 的 事务 处 理由 60% 的 读 操作 和 40% 
的 写 操作 组 成 。 平 均 说 来 ,磁盘 的 访问 时 间 是 20 毫秒 。 

现在 ,该 系统 的 磁盘 空间 已 经 基本 用 完 ， 而且 所 有 磁盘 的 预期 寿命 也 接近 结束 ， 所 以 马上 必须 预 
定 新 的 磁盘 来 代替 。 于 是 你 会 觉得 这 是 一 个 安装 RAID 的 好 时 机 ， 当 然 还 需 购买 一 些 额外 的 磁盘 。 你 
找到 一 种 适合 于 系统 的 磁盘 ， 每 一 个 容量 10GB 的 磁盘 组 的 价格 为 2 000 美元 。 新 磁盘 的 平均 访问 时 间 
是 15 毫秒 ，MTTF 为 20 000 小 时 而 MTTR 为 4 小 时 。 你 计划 需要 有 60GB 的 存储 容量 来 保存 现 有 的 
数据 和 预期 随后 5 年 内 可 能 增加 的 数据 。 将 要 替换 掉 原 来 的 所 有 磁盘 。 

a) 对 于 反对 在 系统 中 增加 RAID 的 人 ， 他 们 有 关 磁 盘 速 度 减 慢 50% 将 会 导致 收入 下 降 到 每 小 时 5 000 
美元 的 断言 是 否 正 确 ? 并 证 明 你 的 答案 。 

b) 如 果 你 决定 采用 RAID-1， 那 么 在 新 系统 中 的 平均 磁盘 访问 时 间 是 多 少 ? 

c) 如 果 系 统 使 用 一 个 带 有 两 组 4 磁盘 的 RAID-5 阵列 ， 而 且 25% 的 数据 库 事务 处 理 必 须 等 待 某 个 事务 

处 理 完毕 直到 该 磁盘 空闲 ， 那 么 平均 磁盘 访问 时 间 又 为 多 少 ? 

d) 对 于 RAID-1 和 RAID-5， 哪 一 种 配置 的 成 本 费用 更 加 合理 一 些 ? 并 解释 理由 。 

a) 在 本 章 所 介绍 的 RAID 系统 中 ， 哪 一 种 系统 不 允许 有 单一 磁盘 的 失效 ? 

b) 哪 一 种 系统 可 以 允许 一 个 以 上 的 磁盘 同时 失效 ? 

计算 图 7-30 中 每 个 JPEG 图 像 的 压缩 系数 。 

对 于 在 第 7. 8. 2 节 中 使 用 的 “Star Bright” 童 谣 ， 生 成 一 个 赫 夫 曼 树 并 分 配 赫 夫 曼 代码 。 其 中 ， 空 格 使 
用 符号 二 ws 之 而 不 是 下 划 线 。 

完成 第 7. 8. 2 节 中 说 明 的 LZ77 数据 压缩 的 全 过 程 。 
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31, 使 用 JPEG 2000 来 压缩 素描 图 像 是 一 个 不 太 明 智 的 选择 ， 正 如 图 7-30 所 示 。 为 什么 ? 你 可 否 建议 采用 
其 他 的 压缩 方法 ? 说 明 选 择 这 种 方法 的 理由 ? 

32, a) 列举 LZ77 胜 过 赫 夫 曼 编 码 的 一 种 优点 。 
b) 列举 赫 夫 曼 编码 胜 过 L277 的 一 种 优点 。 
c) 哪 一 种 压缩 方法 更 好 一 些 ? 

33， 陈 述 PNG 的 一 种 特性 ， 并 且 要 能 够 用 它 来 说 服 别人 PNG 是 一 种 比 GIF 更 好 的 算法 ? 


[asianxmsa 


本 部 分 的 内 容 将 简要 介绍 一 些 的 重要 的 I/O 系统 ， 显 然 读者 在 今后 的 职业 生涯 中 可 能 会 遇 到 这 些 
1/O 系统 。 如 果 对 这 些 系统 有 一 个 综合 的 理解 ,无疑 有 助 于 我 们 做 出 正确 的 决定 ， 在 不 同 的 应 用 中 选 
择 最 好 的 方法 。 最 重要 的 是 ， 我 们 将 了 解 现 代 存 储 系 统 正 在 以 它们 特有 的 方式 成 为 独立 的 系统 ， 这 些 
存储 系统 的 体系 结构 模型 与 一 台 计算 机 主机 系统 的 内 部 结构 有 很 大 的 区 别 。 在 讨论 复杂 的 体系 结构 之 
前 ， 首 先 介绍 有 关 的 数据 传输 模式 。 


7A.2 数据 传输 模式 


信息 字 节 可 以 在 一 个 主机 和 一 个 外 围 设备 之 间 进行 传输 。 如 果 在 传输 过 程 中 每 次 发 送 一 位 数据 称 
为 串 行 (serial) 通信 方式 ， 而 每 次 发 送 一 个 字 节 称 为 并 行 (parallel) 通信 方式 。 每 种 传输 模式 都 会 在 
主机 和 设备 接口 之 间 建 立 一 种 特定 的 通信 协议 。 在 接 下 来 的 章节 中 ， 我 们 将 讨论 在 存储 系统 中 使 用 的 
几 种 重要 协议 。 这 里 的 思想 许多 都 会 延伸 到 数据 通信 的 领域 (参见 第 11 章 )。 


7A. 2. 1 并 行 数 据 传输 


并 行 通信 系统 的 工作 方式 与 一 个 主机 的 存储 器 总 线 的 操作 非常 类 似 。 至 少 要 求 8 根 数据 线 (每 一 
位 数据 对 应 于 一 根 数据 线 ) ， 而 且 还 需要 一 根 线 来 进行 同步 。 这 根 同步 线 有 时 也 称 为 选 通 线 (strobe)。 

并 行 连接 对 于 短 距离 传输 非常 有 效 ， 通 常 短 于 30 英尺 。 具 体 长 度 主要 取决 于 信号 的 强度 、 信 号 
的 频率 和 电缆 的 质量 。 在 长 距离 的 数据 传输 时 ， 电 缆 中 的 信号 会 因为 导体 的 内 部 电阻 而 不 断 减弱 。 这 
种 电信 号 随 着 距离 和 时 间 的 增加 而 损失 的 现象 称 为 衰减 (attenuation)。 通 过 学 习 一 个 例子 后 ， 这 种 与 
衰减 相关 的 问题 就 会 变 得 更 加 清楚 。 

图 7A-l 给 出 了 一 个 并 行 打 印 机 接口 的 简化 时 序 图 。 图 中 标注 为 nStrobe 和 nAck 的 两 条 线 分 别 用 
来 发 送 选 通信 和 号 和 应 答 信和 号， 加 载 低 电压 有 效 。 当 施加 高 电压 时 ，Busy 和 Data 信号 送出 。 换 言 之 ， 
Busy 和 Data 信号 属于 正 逻 辑 信和 号， 而 nStrobe 和 nAck 信号 都 是 负 逻 辑 信号 。 在 时 序 图 的 顶部 ， 列 
出 了 从 to 到 zs 之 间 的 任意 参考 时 间 。 两 个 连续 参考 时 间 之 差 和 
At 决定 总 线 的 速度 。 通 常情 况 下 ，At 的 范围 在 1 毫秒 和 5 
毫秒 之 间 。 

图 7A-1 说 明了 在 一 个 打印 机 接口 电路 〈 位 于 主机 上 ) 和 Busy 
一 台 并 行 打印 机 的 主机 接口 之 间 所 发 生 的 握手 协议 。 当 在 8 
个 数据 线 的 每 根 线路 上 放置 1 位 数据 时 ， 这 个 握手 的 过 程 就 
开始 了 。 接 下 来 ， 就 是 检测 busy 信号 线 是 否 处 于 低 电 平 . 一 pa 大 人 ， 
旦 检测 到 busy 信号 线 为 低 电 平 ， 则 有 效 送出 strobe 信号 ， 这 wp 
样 打印 机 就 知道 了 数据 线 上 有 数据 送 入 。 只 要 打印 机 检测 到 图 7A-1 一 台 并 行 打印 机 的 简化 时 序 图 
strobe 信号 ， 它 就 会 读 取 数 据 线 v 同时， 将 busy 信号 升 起 来 变 数据 信号 表示 8 根 不 同 的 线 。 每 根 数 
为 高 电 平 ， 以 防止 主机 向 数据 线 上 放置 更 多 的 数据 。 在 打印 机 据 线 或 者 是 高 电 平 或 者 是 低 电 平 (信号 1 
已 经 读 取 数 据 线 上 的 数据 之 后 ，busy 信号 变 成 低 电 平 ， 同 时 发 。 或 信号 0)。 这些 数据 线 上 的 信号 在 
出 一 个 应 答 信号 nAck， 让 主机 知道 已 接收 数据 。 nStrobe 信号 发 出 之 前 和 在 nAck 信号 发 出 

值得 注意 的 是 ， 尽 管 已 经 确认 数据 信号 ， 但 是 这 并 不 能 。 “之 后 都 是 没有 意义 的 图 中 阴影 部 分 )。 
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保证 这 些 数据 的 正确 性 。 主 机 和 打印 机 都 假设 接收 到 的 信号 和 发 送 的 信号 是 完全 一 样 的 。 对 于 短 距离 
传输 ， 这 样 的 很 设 是 相当 安全 的 。 但 是 对 于 长 距离 传输 来 说 ,情况 并 非 如 此 。 

现在 假定 总 线 操作 的 电 平 为 十 5V 或 一 5V。 因 此 ，0 和 十 5V 之 间 的 任何 电压 都 会 被 认为 是 “高 ” 
电 平 ， 而 0 和 一 5V 之 间 的 任何 电压 都 会 被 认为 是 “ 低 ” 电 平 。 主 机 在 不 同 的 数据 线 上 设置 十 5V 电压 
或 一 5V 电压 ,分 别 对 应 于 数据 字 节 中 不 同位 的 数据 1 和 0。 随 后 ， 主 机 会 设置 strobe 线 为 一 5V 电压 。 

在 伴随 有 “ 轻 度 (mild)” 衰 减 的 情况 下 ， 打 印 机 检测 nstrobe 信号 或 者 是 主机 去 检测 nAck 信号 
时 的 速度 可 能 会 减 慢 。 如 果 连 接 有 多 个 打印 机 时 ， 这 种 速度 上 的 小 阻 现象 几乎 很 难 被 察 常 到。 但 是， 
在 我 们 通常 希望 能 够 立即 响应 的 并 行 磁盘 接口 上 ， 这 种 速度 上 的 迟缓 是 令 人 可 怕 的 。 

如 果 采 用 一 根 很 长 的 传输 电缆 ， 在 打印 机 的 终端 上 可 能 会 收 到 完全 不 同 的 电压 信号 。 当 信和 号 到 达 
打印 机 时 ,“ 高 ” 电 平 可 能 是 十 JV， 而 “ 低 ” 电 平 可 能 是 一 3V。 如 果 十 1V 电压 并 不 足以 高 于 逻辑 1 的 
门限 电压 ， 那 么 在 打印 机 的 信号 处 理 过 程 中 ， 我 们 就 会 在 应 该 输出 一 个 1 的 地 方 得 到 一 个 0 输出 的 结 
果 。 同 样 ， 经 过 了 长 距离 的 传输 ，strobe 信和 号 可 能 会 在 数据 位 信号 之 前 到 达 打 印 机 。 这 种 情形 下 ， 打 
印 机 就 会 对 检测 到 nstrobe 信号 时 放置 在 数据 线 上 各 种 信号 进行 打印 。 这 时 ， 可 能 发 生 的 极端 情况 是 
一 个 文本 字符 被 误 认为 一 个 控制 字符 。 这 样 就 可 能 引起 打印 机 输出 乱码 和 出 现 死 机 的 情况 。 


7A. 2.2 串 行 数据 传输 


从 上 面 我 们 可 以 看 到 ， 并 行 数 据 传输 是 沿 着 数据 总 线 每 次 移动 一 个 信息 字 节 。 在 并 行 数据 传输 中 ， 
每 一 位 数据 都 要 求 有 一 根 数据 线 ， 并 且 这 些 数据 线 由 一 根 独立 的 strobe 线 的 脉冲 来 激活 。 与 并 行 数据 
传输 不 同 ， 串 行 数据 传 输 只 用 一 根 导线 来 发 送 数据 ， 每 次 只 能 传送 1 位 数据 ， 就 像 单数 据 线 上 的 脉冲 
信号 。 当 然 ， 串 行 数 据 传输 还 需要 有 其 他 的 一 些 导线 来 传送 协议 所 定义 的 特殊 信号 。RS-232-C 就 是 这 
样 的 一 个 串 行 通 信 协 议 ， 它 要 求 有 独立 的 信号 线 。 但 是 ， 它 的 数据 发 送 仍然 只 用 一 条 数据 线 (参见 第 
11 章 )。 串 行 存 储 器 的 接口 会 将 这 些 特殊 的 信号 加 入 到 沿 着 数据 通路 进行 交换 的 协议 帧 中 。 本 节 后 面 
将 仔细 研究 一 些 串 行 存 储 器 协议 。 

串 行 传输 方法 也 可 以 被 用 作 时 间 人 敏感 的 同步 (isochronous〉 数据 传输 。 则 步 协议 主要 用 于 实时 数 
据 的 传送 ， 比 如 语音 和 视频 信号 。 因 为 语音 和 视频 信号 主要 用 于 人 们 的 感觉 ， 所 以 一 点 偶尔 的 传输 错 
误 并 不 会 造成 重大 的 影响 。 这 种 数据 的 近似 特性 允许 少量 的 错误 控制 。 因 此 ， 这 种 从 起 始 〈 源 ) 端 发 
送 到 目标 端的 数据 流动 可 以 具有 最 小 的 由 于 协议 造成 的 延迟 时 间 。 


7A.3 SCSI 


小 型 计算 机 系统 接口 ， 简 称 SCSI (发 音 “skuzzy”) ， 是 由 Shugart Associates 和 NCR 公司 在 1981 
年 发 明 的 。Shugart Associates 是 当时 磁盘 驱动 器 的 主要 制造 厂商 ， 而 NCR 也 曾经 在 小 型 计算 机 市 场 
中 扮演 关键 的 角色 。 这 个 接口 开始 时 称 为 SASI 接口 ， 即 Shugart Associates Standard Interface。 因 为 
这 种 接口 设计 精良 ， 所 以 在 1986 年 成 为 了 ANSI 标 准 。ANSI 委员 会 将 这 个 新 的 接口 称 为 SCSI， 认 为 
使 用 更 通用 的 名 称 会 比较 好 。 , 

最 初 的 标准 SCSI 接口 (现在 称 为 SCSI-1) 定义 了 一 组 命令 、 传 输 协 议和 若干 物理 连接 。SCSI 规定 
了 连接 到 CPU 的 驱动 器 的 最 大 数目 〈7 个 )， 和 最 高 传输 速率 : 每 秒 5MB。 这 种 接口 的 创新 思想 是 将 智 
能 化 的 技术 引进 到 接口 中 ， 使 得 SCSI 或 多 或 少 具有 一 些 自我 管理 的 能 力 。 这 样 ，CPU 可 以 被 解放 出 来 
从 事 计 算 工 作 ， 而 不 是 一 直 忙 于 MO 接口 的 任务 。 在 20 世纪 80 年 代 早 期 ， 大 多 数 小 型 计算 机 系统 运行 
的 时 钟 速率 在 2MHz 和 8. 44MHz 之 间 ， 这 使 得 SCSI 总 线 的 吞吐 量 在 当时 看 起 来 还 是 相当 引 人 注 目的 。 

如 今 ，SCSI 已 经 发 展 到 了 第 三 代 ， 即 SCSI-3。SCSI-3 包括 多 个 接口 标准 。SCSI-3 是 一 种 体系 结 
构 ， 正 式 称 为 SCSI-3 体系 结构 模型 (SCSI3 Architecture Model，SAM)。SCSI-3 中 定义 了 一 个 包含 有 
层 间 通信 协议 的 分 层 系统 。 这 种 体系 结构 中 既 包 括 了 “标准 的 ”并 行 SCSI 接口 ， 也 包含 有 3 个 串 行 接 
口 和 一 个 混合 接口 。 在 第 7A. 3. 2 节 中 ， 我 们 会 更 详细 地 讨论 SAM 结构 。 
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7A. 3.1 “标准 ”的 并 行 SCSI 


假设 有 人 对 你 说 ,“ 我 们 刚刚 安装 了 一 个 带 有 3 个 巨型 SCSI 驱动 器 的 新 BackOffice 服务 器 ,” 或 者 
说 ,“ 我 的 系统 自从 升级 到 SCSI 后 运行 速度 飞快 >。 那 么 说 话 人 所 提 及 的 可 能 是 指 一 个 SCSI-2 或 者 是 
一 个 并 行 SCSL3 的 磁盘 驱动 器 系统 。 在 20 世纪 80 年 代 ， 这 种 说 法 有 些 夸 大 其 词 ， 原 因 是 当时 在 连接 
和 配置 第 一 代 SCSI 设备 时 非常 环 手 。 而 如 今 ， 不 但 SCSI 的 传输 速率 提高 了 几 个 数量 级 ， 而 且 SCSI 设 
备 中 的 智能 化 程度 更 高 ， 实 际 上 消除 了 早期 SCSI 适配器 中 一 些 棘手 的 问题 。 

并 行 SCSL3 磁盘 驱动 器 支持 很 宽 的 传输 速率 范围 : 从 10MB/s 到 80MB/s， 分 别 对 应 于 向 下 兼容 
早期 的 SCSI-2 和 最 新 的 宽带 、 快 速 和 超级 的 SCSI-3 设备 的 实现 。SCSI-3 诸多 优点 中 的 其 中 之 一 是 ， 
单一 SCSI 总 线 可 以 支持 上 述 范围 的 设备 速度 ， 而 无 需 重新 连 线 或 替换 驱动 器 。 但 是 对 于 这 一 点 ,没有 
人 可 以 给 予 任 何 性 能 上 的 保证 。 有 关 SCSI 的 一 些 代 表 性 特征 可 以 参见 表 7A-1。 


表 7A-1 不 同 SCSI 能 力 的 概况 





快速 SCSI 











SCSI:3 并 行 体 系 结构 的 灵活 性 和 强大 功能 可 能 大 部 分 都 要 归咎 于 ，SCSI 设备 能 够 在 自身 之 间 进 行 
通信 。SCSI 设 备 是 沿 着 二 条 总 线 构成 菊花 链接 (daisy-chained) 的 结构 ， 即 一 个 设备 的 输出 利用 电缆 
连接 到 另 一 个 设备 的 输入 。CPU 只 与 其 SCSI 主机 适配器 进行 通信 ， 当 有 需要 时 发 布 各 种 I/O 命令 。 
在 接 下 来 的 其 他 时 间 ，CPU 会 处 理 自己 的 工作 任务 ， 而 由 适配器 来 负责 管理 输入 或 输出 操作 。 图 7A-2 
为 一 个 SCSI-2 系统 的 组 织 结构 图 。 


设备 7 





图 7A-2 SCSI-2 的 配置 


“快速 ”并 行 SCSI-2 和 SCSF3 电缆 中 有 50 根 导线 。 其 中 的 8 根 用 于 数据 传输 ，11 根 用 作 各 种 不 同 
类 型 的 控制 。 剩 下 的 导线 用 于 电学 接口 。 在 开始 进行 一 个 数据 或 命令 传送 之 前 ， 先 要 将 设备 选择 (SEL) 
信和 号 放 到 数据 总 线 上 。 因 为 只 有 :8 根 数据 线 ， 所 以 最 多 只 能 够 支持 7 个 设备 ， 另 外 一 个 设备 是 主机 适 配 
器 .“ 人 快速 和 宽带 ”SCSI 电 缆 有 16 位 的 数据 总 线 ， 人 允许 支持 14 个 设备 ， 数 据 传输 的 速率 也 增加 到 2 倍 。 
某 些 “快速 和 宽带 ”的 SCSI 系 统 使 用 2 根 68 芯 电 缆 ， 与 使 用 1 根 68 芯 电 缆 的 系统 相 比 ， 它 们 能 够 支持 
设备 数目 和 数据 传输 速率 都 增加 了 1 倍 。 表 7A-2 说 明了 50 芯 导 线 的 SCSI 电缆 引 脚 的 功能 。 
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表 7A-2 SCSI 的 D 类 型 连接 器 的 引 脚 
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Termination power Motor power nreset 






人 












12V or 5V power n MeSsaGe 46 









12V or 5V (logic) n SELect 












nC/D 


ed Synchronization n REQuest 
n BuSY nl/O 

注 : 信号 名 称 的 首 字母 ”表示 负 逻 辑 信号 : 当 信 号 为 负 值 时 ， 该 信号 断言 有 效 。 

并 行 SCSI 设备 彼此 之 间 以 及 与 主机 适配器 之 间 使 用 一 个 异步 协议 进行 通信 。 通 信 的 过 程 按 照 8 个 
相 来 运行 ， 每 个 相 都 定义 有 严格 的 时 序 。 也 就 是 说 ， 如 果 某 个 相 没 有 能 够 在 规定 的 几 毫 秒 内 完成 ( 具 
体 数值 取决 于 总 线 的 速度 )， 计 算 机 会 认为 这 个 相 出 错 ， 而 且 该 协议 就 要 从 当前 相 的 开始 处 重启 。 发 送 
数据 的 设备 称 为 启动 设备 (initiator) ， 接 收 数据 的 设备 称 为 目标 〈target) 设备 。SCSI 协议 的 8 个 相 的 
具体 描述 如 下 。 图 7A-3 为 利用 状态 图 来 阐明 这 8 个 相 之 间 的 关系 。 


BUS= 目标 设备 ID 
SEL 有 效 


BSY 置 低 电 平 
区 


Ground 






Data bit 0—>Data bit 7 











Parity bit 








BUS= 启动 设备 ID 
BSY 有 效 







SEL 人 
C/D 


BUS 交 
1% Dy /有 效 





BUS=“ 命 令 完成 ” 
MSG 有 效 


7A-3 并 行 SCSI 的 8 相 的 状态 图 (虚线 表示 出 错 的 条 件 ) 

。 总 线 空 闪 (bus free) : 启动 设备 首先 对 “bus busy”(BSY) 信号 线 进行 查询 ， 判 断 在 进入 下 一 个 
阶段 前 总 线 是 否 空闲 ;或 者 是 在 数据 传输 完成 后 将 BSY 信号 置 为 低 电 平 。 

， 仲裁 〈arbitration) : 启动 设备 会 将 设备 的 ID 放 到 总 线 上 并 升 高 busy 信号 电 平 ， 来 竞争 获取 总 线 
的 控制 权 。 如 果 同 时 有 两 个 设备 请 求 控制 总 线 ， 那 么 具有 最 大 ID 值 的 设备 将 获得 总 线 的 控制 
权 ; 而 没有 取得 控制 总 线 权 的 设备 必须 等 待 男 一 个 “总 线 空闲 ”状态 。 

。 选 择 (selection) : 随后 ， 启 动 设备 将 目标 设备 的 地 址 放 到 数据 总 线 上 ， 升 高 选择 (SEL) 信号 电 
平 ， 并 将 BSY 信号 置 为 低 电 平 。 当 目标 设备 在 总 线 上 看 到 自己 的 设备 ID，SEL 信 号 又 为 高 电 平 ， 
以 及 BsY 和 I/O 信 和 号 为 低 电 平时 ， 就 会 将 BSY 信和 号 电 平 升 高 ， 并 存储 启动 设备 的 ID 以 备 后 用 。 
如 果 发 现 BSY 信号 线 被 断言 有 效 ， 启 动 设备 也 就 知道 了 目标 设备 已 经 准备 就 绪 ， 并 且 会 通过 降 
低 SEL 信号 电 平 做 出 响应 。 

“命令 (command); 一 旦 目标 设备 检测 到 启动 设备 的 SEL 信号 无 效 ， 那 它 就 会 在 命令 /数据 
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(C/D) 线 上 发 送 “ 命 令 准 备 好 ”信和 号， 指示 目标 设备 已 经 准备 好 接收 一 个 命令 。 然 后 ， 目 标 设 
备 会 升 高 REQ 信和 号， 请 求 命令 信号 本 身 。 当 启动 设备 检测 到 c/D 和 REQ 信号 有 效 后 ， 就 会 把 第 
一 个 命令 放 到 数据 总 线 上 ， 同 时 发 出 ACK 信和 号。 目标 设备 会 对 传送 的 命令 做 出 响应 ， 然 后 升 高 
自己 的 ACK 信号 对 启动 设备 做 出 应 答 ， 表 示 该 命令 已 经 被 接收 。 接 下 来 ,目标 设备 和 启动 设备 
就 会 利用 ACK 信和 号 相互 应 答 ， 交 换 命令 的 各 个 字 节 ， 直 到 全 部 的 命令 字 节 传输 完毕 。 

在 这 一 过 程 中 ， 启 动 设备 和 目标 设备 会 释放 总 线 ， 以 便 在 磁盘 的 读 / 写 头 对 磁盘 进行 定位 期 
间 ， 其 他 的 设备 可 以 使 用 总 线 。 这 样 一 来 ， 就 允许 有 多 个 总 线 的 并 发 过 程 。 但 是 这 显然 会 产生 更 
多 的 成 本 费用 ， 原 因 在 于 在 数据 被 转移 到 启动 设备 之 前 ， 必 须 重新 协商 总 线 的 控制 权 问 题 。 

* 数据 (data) : 在 接收 到 完整 的 命令 后 ， 目 标 设备 会 降低 c/D 信号 电 平 ， 将 总 线 设 置 为 “数据 ” 模 
式 。 根 据 数据 传输 过 程 是 从 起 始 端 到 目标 端的 输出 〈 例 如 ， 磁 盘 写 ) ， 还 是 从 目标 端 到 起 始 端的 输 
人 和 人“ 例如， 磁盘 读 ) ，CPU 会 将 输入 /输出 线 分 别 置 于 无 效 或 断言 有 效 状 态 。 然 后 将 数据 字 节 送 到 
总 线 上 ， 并 采用 与 命令 阶段 所 使 用 的 相同 的 “REQ/ACK” 握 手 协议 来 完成 该 数据 字 节 的 传送 。 

“ 状态 〈status) : 一 旦 该 数据 的 所 有 字 节 传输 完毕 ， 目 标 设备 就 会 升 高 C/D 信号 电 平 ， 将 总 线 重 
新 置 于 命令 方式 。 然 后 ， 目 标 设备 会 发 送 一 个 REQ 信和 号， 并 等 待 一 个 来 自 启动 设备 的 AcK 信号 ， 
指示 启动 设备 目前 空 疮 和 已 经 准备 好 接收 一 个 命令 。 

“消息 (message) : 当 目 标 设备 得 知 启动 设备 已 经 准备 就 绪 后 ， 就 会 把 “命令 完成 ”的 代码 送 到 数 
据 线 上 ， 然 后 断言 “消息 ” 线 ，MSG 有 效 。 如 果 看 到 “命令 完成 ”的 消息 ， 启 动 设备 就 将 总 线 上 
的 所 有 信和 号 都 设置 为 低 电 平 ， 这 样 使 总 线 返回 到 “总 线 空闲 ”状态 。 

* 重新 选择 (reselection) : 假如 某 个 传输 过 程 发 生 中 断 ， 例 如 当 总 线 被 释放 的 同时 又 在 等 待 一 个 磁 
盘 或 磁带 的 服务 请 求 ， 那 么 就 要 利用 上 述 的 总 线 仲 裁 阶段 来 重新 获取 对 总 线 的 控制 权 。 如 果 启 
动 设备 通过 自己 的 异 或 操作 看 到 SEL 线 和 I/0 线 都 被 断言 有 效 和 数据 线 上 有 目标 设备 的 ID 时 ， 
就 判定 它 已 经 进行 重新 选择 阶段 。 然 后 ， 协 议会 在 数据 阶段 重启 。 

同步 SCSI 数据 传输 原理 非常 类 似 于 刚才 介绍 的 异步 传输 方法 。 二 者 之 间 的 主要 区 别 在 于 同步 方法 

在 每 个 数据 字 节 的 传送 之 间 并 不 要 求 有 握手 协议 。 相 反 ， 同 步 传输 在 启动 设备 和 目标 设备 之 间 需 要 协 
商 一 个 最 小 的 传输 时 间 间 隔 。 数 据 传送 就 在 这 个 协商 好 的 时 间 间 隔 内 进行 。 然 而 ， 在 下 一 个 数据 块 发 
送 之 前 ， 将 会 有 REQ/ACK 握手 协议 的 情况 发 生 。 

读者 很 容易 看 到 ， 时 序 对 SCSI 的 有 效 性 是 非常 的 重要 。 如 果 一 个 设备 发 生 错 误 ， 规 定 的 等 待 时 间 

上 限 可 以 防止 接口 电路 被 挂 起 而 中 止 工作 。 如 果 和 情况 并 非 如 此 ， 那 么 就 可 以 通过 从 驱动 器 中 移 走 软盘 
来 阻止 一 个 对 硬盘 的 访问 操作 ， 因 为 这 时 的 总 线 可 能 会 被 “永远 ”地 (或 者 至 少 要 等 到 系统 重新 启动 ) 
标记 为 忙 的 状态 。 在 长 距离 电缆 传输 过 程 中 所 产生 的 信号 衰减 可 能 会 造成 超时 的 情况 发 生 ， 这 样 会 使 
得 整个 的 系统 的 速度 变 慢 和 不 可 靠 。 相 对 而 言 ， 串 行 接口 允许 时 序 同步 发 生 差异 的 能 力 会 大 得 多 。 


7A. 3.2 SCSI-3 体系 结构 模型 


SCSI 已 经 从 一 个 由 协议 、 信 号 和 导线 组 成 的 单 片 系统 发 展 成 为 现在 的 分 层 接口 规范 ， 这 种 分 层 结 
构 将 物理 连接 与 传输 协议 和 接口 命令 分 隔 开 来 。 这 种 新 的 规范 称 为 SCSI-3 体系 结构 模型 (SAM)。 
SAM 定义 了 这 些 物理 分 层 结 构 ， 以 及 分 层 与 一 个 称 为 SCSI-3 通用 访问 方法 (Common Accesss Meth- 
od，CAM) 的 命令 层 主机 体系 结构 之 间 是 如 何 相 互 作用 的 。 对 于 实际 连接 到 计算 机 系统 的 任何 类 型 设 
备 ， 这 种 新 规范 都 能 够 实现 串 行 和 并 行 /O 功能 。 各 个 分 层 通过 协议 服务 请 求 、 指 示 、 响 应 和 确认 来 
进行 相互 间 的 通信 。 类 似 这 样 的 松散 看 合 的 协议 堆栈 (或 释 层 ) 使 得 我 们 在 选择 接口 硬件 、 软 件 和 介 
质 时 可 以 有 较 大 的 灵活 性 。 并 且 ， 在 某 个 层 上 面 进行 的 技术 改进 不 会 影响 到 其 他 层 的 操作 。 对 于 磁盘 
存储 系统 来 说 ，SAM 的 灵活 性 已 经 开辟 了 SCSI 接口 在 速度 和 适应 性 方面 的 一 个 新 天 地 。 

图 7A-4 表示 SAM 的 各 组 件 的 连接 示意 图 。 虽 然 SAM 体系 结构 保持 了 向 下 与 SCSI 并 行 协议 和 接口 的 
兼容 性 ， 但 是 最 大 型 的 和 最 快速 的 计算 机 系统 现在 仍然 使 用 串 行 方法 。SAM 的 各 种 串 行 协议 包括 串 行 存储 





选择 碰 嫂 疗 久 器 的 实现 专题 239 





器 体系 结构 (Serial Storage Architecture，SSA) 、 串 行 总 线 (Serial Bus， 也 称 为 EEE1394 或 FireWire) 和 光 
纤 信 道 〈Fibre Channel，FC)。 尽 管 所 有 的 串 行 协议 都 支持 一 个 并 行 SCSI 到 串 行 的 转换 映射 ， 但 是 类 属 包 协 
议 (Generic Packet Protocol，GPP) 在 处 理 这 个 问题 方面 却 是 最 灵活 通用 的 。 由 于 SCSI-3 总 线 的 高 速 性 能 和 
系统 之 间 相 互 连 接 的 多 样 性 ,“ 人 小 型 计算 机 系统 接口 ”中 的 这 个 “小 ”其 实 已 经 变 成 一 种 误 用 。 事 实 上 ,各 
种 各 样 的 SCSI 已 经 应 用 于 从 最 小 型 个 人 计算 机 到 最 大 型 主机 系统 的 所 有 设备 中 。 





图 7A-4 SCSI 体系 结构 模型 (SAM) 


每 个 SCSI-3 串 行 协议 都 有 自己 的 协议 堆栈 ， 协 议 堆 栈 都 要 服从 于 顶层 的 SCSI-3 通用 访问 方法 ， 
而 且 还 要 清楚 定义 传输 协议 和 底层 的 物理 接口 系统 。 串 行 协议 以 包 (或 帧 ) 的 形式 发 送 数据 。 这 些 数 
据 包 由 一 组 字 节 构成 ， 其 中 包含 标识 信息 〈 即 包头 )、 数 据 字 节 〈 称 为 包 的 有 效 载荷 ) 和 包 的 结束 处 的 
某 种 尾部 界定 符 。 在 许多 SAM 协议 中 ， 包 的 尾部 还 包含 错误 检测 代码 。 

在 本 节 的 余下 部 分 ， 我 们 会 仔细 研究 几 个 更 令 人 感 兴趣 的 SAM 串 行 协议 。 

20 世纪 80 年 代 后 期 ， 并 行 SCSI 系统 是 占 主导 地 位 的 接口 系统 。 现 在 称 之 为 IEEE 1394 的 接口 系 
统 起 源 于 莉 果 计算 机 人 公司。 当时， 苹果 计算 机 公司 注意 到 有 必要 创建 一 个 比 SCSI 系统 更 快 、 更 可 靠 的 
系统 。 芋 果 公 司 将 这 个 接口 称 为 FireWire， 现 在 FireWire 可 以 提供 40MB/s 总 线 速 度 ， 而 且 预 期 在 未 
来 可 能 会 有 更 高 的 速度 。 

IEEE 1394 不 仅 只 是 一 个 存储 器 的 接口 系统 ， 它 是 一 个 对 等 存储 器 网 络 。 它 连接 的 设备 都 具有 智 
能 化 的 功能 ， 允 许 设备 彼此 之 闻 以 及 设备 与 主机 控制 器 之 闻 进 行 相互 通信 。 这 些 通信 和 包括 了 传输 速度 
的 协商 和 总 线 的 控制 等 内 容 。 遍 及 IEEE 1394 协议 的 各 个 层次 都 具有 这 些 功能 ， 如 图 7A-5 所 示 。 

IEEE 1394 不 仅 比 早期 的 并 行 SCSI 提供 更 快 的 数据 传输 ， 而 且 仅 使 用 一 种 很 薄 的 电缆 连接 线 。 电 
缆 中 只 有 6 根 带 线 ， 其 中 4 根 用 于 数据 和 控制 ， 另 外 2 根 用 于 电源 。 这 种 小 型 的 电缆 比 带 有 50 芯 的 
SCSI-1 或 SCSL2 的 电缆 更 加 经 济 和 更 易于 管理 。 而 且 ，IEEE 1394 电缆 可 以 在 设备 之 间 延 长 到 15 英 
尺 (4.5 米 )。 并 允许 高 达 63 个 设备 在 一 条 总 线 上 构成 菊花 链 连接 。IEEE 1394 的 连接 器 是 一 种 标准 的 
接头 ， 在 样式 上 与 游戏 机 的 连接 器 非常 相似 。 

整个 的 IEEE 1394 系统 是 自 配 置 的 系统 。 在 系统 正在 运行 时 ，IEEE 1394 接口 允许 大 量 的 设备 非 
常 方便 地 进行 热 插 拔 (hot-plugging)， 或 者 说 即 插 即 用 (plug and play)。 然 而 ， 热 播 拔 需要 花费 一 定 
资源 开销 。 计 算 机 需要 采用 轮流 检测 来 确定 连接 到 接口 的 各 个 设备 ， 这 样 最 终 会 限制 接口 的 吞吐 量 。 
而 且 ， 如 果菜 个 连接 器 正在 忙于 处 理 一 长 串 的 同步 数据 时 ， 那么 它 就 不 可 能 在 传输 数据 过 程 中 对 一 个 
正在 接 插 设备 立即 做 出 应 答 。 | 

我 们 还 可 以 将 设备 插 到 其 他 一 些 设备 的 附加 端口 上 ， 这 样 产生 一 个 如 图 7A-6 所 示 的 树 型 结构 。 
对 于 数据 MO 来 说 ， 树 型 结构 的 用 途 是 非常 有 限 的 。 由 于 支持 同步 数据 传输 ， 因 此 IEEE 1394 在 消费 
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驱动 器 和 DMA 控制 器 


图 7A-5 IEEE 1394 的 协议 堆栈 






MIDI 键盘 
ee 


图 7A26 IEEE 1394 的 树 型 结构 配置 ， 连 接 有 不 同 的 消费 类 电子 产品 


类 电子 产品 中 得 到 了 广泛 的 认同 。 在 实验 室 的 数据 获取 应 用 方面 ，IEEE 1394 也 正在 取代 以 往 采 用 的 
IEEE 488 通用 接口 总 线 (General Purpose Interface Bus，GPIB)。 由 于 主要 专注 于 实时 数据 的 处 理 ， 


所 以 IEEE 1394 不 太 可 能 替代 SCSI 成 为 高 容量 的 数据 存储 器 接口 。 
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尽管 串 行 存储 器 体系 结构 〈Serial Storage Architecture，SSA) 有 许多 优点 ， 但 是 在 存储 器 接口 的 
领域 中 ， 它 面临 着 被 淘汰 的 可 能 。 在 20 世纪 90 年 代 早期 ，IBM 公司 和 许多 计算 机 制造 公司 一 样 ， 都 
在 寻找 一 种 更 快 更 可 靠 的 替代 并 行 SCSI 接 口 的 产品 用 于 大 型 计算 机 的 磁盘 存储 器 系统 。 对 于 长 距离 电 
缆 传 输 ，IBM 公司 的 工程 师 决 定 采用 串 行 总 线 。 这 种 串 行 总 线 要 求 既 简洁 又 具有 低 的 衰减 。 而 且 ， 还 
要 求 总 线 的 吞吐 量 增加 和 保持 向 下 兼容 SCSI-2 协议 。 经 过 充分 的 精简 和 修改 ，IBM 公司 终于 在 1992 
年 的 年 底 向 ANSI 建议 将 SSA 定 为 一 种 工业 标准 。 在 1996 年 的 下 半年 该 标准 被 批准 通过 。 

SSA 的 设计 可 以 利用 一 个 环形 结构 的 连接 方式 ， 支 持 多 个 磁盘 驱动 器 和 多 台 主 机 系统 ， 如 图 7A-7 
所 示 。 连 接 电缆 是 一 根 由 两 对 双 绞 铜 线 组 成 的 4 芯 导 线 ， 人 允许 信号 在 环形 结构 中 进行 相反 方向 传送 。 因 
为 这 种 连接 上 的 宛 余 性 ， 所 以 即使 有 一 个 驱动 器 或 主机 适配器 失效 ， 也 并 不 会 影响 对 其 他 磁盘 的 访问 。 

这 种 SSA 体系 结构 的 双环 拓扑 结构 同样 使 接口 的 基本 吞吐 量 从 40MB/s 增加 到 80MB/s。 如 果 所 
有 节点 都 能 够 正常 运转 ， 那 么 各 个 设备 就 能 够 按照 全 双 工 (full-duplex) 模式 进行 相互 间 通 信 ， 即 在 环 
形体 系 结构 中 数据 可 以 同时 进行 双向 传输 。 

SSA 设备 可 以 管理 它们 自己 的 某 些 IO 系统 。 例 如 ， 在 图 7A-7 中 ， 当 主机 适配器 B 正在 向 磁盘 3 
写 数据 的 同时 ， 主 机 适配器 A 可 以 读 取 磁 盘 0 的 数据 ， 磁 盘 1 正在 发 送 数据 到 磁带 单元 ， 而 磁盘 2 也 
正在 向 打印 机 传输 数据 。 在 这 里 ， 并 不 会 因为 总 线 本 身 的 原因 而 导致 吞吐 量 的 下 降 。IBM 称 这 种 思想 
为 空间 复 用 (spatial reuse)。 这 是 因为 ， 如 果 在 起 始 端 和 目标 端 设备 存在 畅通 的 数据 通道 ， 那 么 系统 
的 任何 部 分 都 不 需要 等 待 总 线 。 





磁盘 单元 0 磁盘 单元 1 ”磁带 单元 0 
图 7A-7 串 行 存储 器 体系 结构 (SSA) 的 配置 
由 于 具有 简洁 、 高 速 和 可 靠 的 特点 ，SSA 过 去 一 直 是 大 型 计算 机 系统 的 主要 互 连 方法 ， 直 到 后 来 
光纤 信道 的 出 现 。 





1991 年 ， 在 瑞士 日 内 巨 ， 欧 洲 原子 核 研究 组 织 〈CERN) 实验 室 的 工程 师 开始 设计 一 种 在 光纤 介质 
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上 传输 网 络 通信 的 系统 。 他 们 称 这 种 系统 为 光纤 信道 (Fibre Channel) ， 这 是 光纤 的 欧洲 拼 法 。 第 二 年 ， 
HP (Hewlett-Packard)、IBM 和 Sun 公司 组 成 一 个 联盟 体 共同 使 用 光纤 信道 作为 磁盘 接口 系统 。 这 个 团 
体 后 来 发 展 成 为 光纤 信道 协会 “Fibre Channel Association，FCA) 。 该 组 织 与 ANSI 一 起 ， 为 存储 器 设备 
的 高 速 接口 建立 了 一 个 精确 和 牢固 的 物理 模型 。 虽 然 最 初 的 目标 是 定义 光纤 接口 ， 但 是 光纤 信道 协议 也 
适用 于 双 绞 线 和 同 轴 铜 芯 电缆 。 光 纤 信 道 的 存储 器 系统 具有 三 种 类 型 的 拓扑 结构 : 交换 式 结构 、 点 对 点 
结构 和 环 状 结构 。 环 状 拓扑 结构 又 称 为 光纤 信道 仲裁 环 (Fibre Channel Arbitrated Loop，FC-AL)， 是 这 
三 种 结构 中 应 用 最 广泛 的 ， 也 是 成 本 费用 最 低 的 结构 。 光 纤 信 道 的 各 种 拓扑 结构 如 图 7A-8 所 示 。 





9) 带 集线器 的 环 状 结构 d) 交换 式 结构 ( 星 型 分 布 ) 
图 7A-8 光纤 信道 的 拓扑 结构 


FC-AL 可 以 提供 100MB/s 的 单方 向 包 传 输 速率 。 从 理论 十 来 说 ， 一 个 环 状 结构 可 以 连接 设备 的 
最 大 数目 为 127。 但是， 考虑 到 各 种 限制 情况 ， 实 际 可 以 连接 设备 数目 为 60。 

注意 ， 图 7A-8 展示 了 两 种 版 本 的 FC-AL: 有 集线器 (c 图 ) 和 没有 集线器 (b 图 )。 图 c 中 的 集 线 
器 是 一 个 交换 设备 。FC-AL 集线器 配备 端口 旁 路 开关 。 只 要 有 一 个 FC-AL 磁盘 失效 时 ， 端 口 旁 路 开 
关 就 会 起 作用 。 如 果 没 有 某 种 类 型 的 端口 旁 路 能 力 ， 那 么 只 要 一 个 磁盘 发 生 故 障 时 ， 整 个 环 就 不 能 够 
正常 工作 (注意 将 这 一 点 与 SSA 结构 相 比较 )。 这 样 ， 在 接口 配置 中 增加 一 个 集线器 可 以 引进 磁盘 失 
效 保 护 机 制 。 因 为 集线器 本 身 可 能 也 会 成 为 一 个 单一 的 故障 点 〈 尽 管 它们 通常 不 会 失效 ) ， 对 于 要 求 高 
可 用 性 的 系统 可 以 安装 多 个 〈 宛 余 ) 集线器 。 

交换 式 光纤 存储 系统 能 够 提供 比 FC-AL 宽 得 多 的 带宽 ， 而 且 对 连接 到 接口 的 设备 数目 (可 多 达 
224) 实际 上 没有 限制 。 在 交换 机 和 节点 之 间 的 每 条 连接 线路 都 可 以 提供 100MB/s 的 传输 速度 。 因 此 ， 
在 两 个 磁盘 相互 之 间 以 100MB/s 的 速度 传输 数据 的 同时 ，CPU 还 能 够 以 100MB/s 速度 向 另外 的 一 个 
磁盘 传输 数据 等 。 正 如 我 们 所 预想 的 那样 ， 交 换 式 光纤 信道 结构 比 环 状 结构 更 加 昂贵 ， 主 要 是 因为 交 
换 式 光纤 信道 需要 一 些 更 加 复杂 的 交换 设备 。 而 且 这 些 设备 的 数目 必须 具有 一 定 的 元 余 性 ， 以 保证 了 
系统 能 够 持续 不 间断 地 操作 。 

光纤 信道 是 数据 网 络 和 存储 器 接口 的 混合 结构 。 光 纤 信 道 协议 堆栈 既 满足 SAM 规范 又 符合 国际 
认可 的 网 络 协议 堆栈 。 光 纤 信 道 协议 堆栈 如 图 7A-9 所 示 。 因 为 高 层 协议 映射 的 缘故 ， 一 个 光纤 信道 存 
储 器 在 配置 安排 上 并 不 二 定 要 求 与 CPU 直接 连接 : 光纤 信道 的 协议 包 可 以 封装 在 一 个 网 络 传输 包 内 ， 
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或 者 作为 一 个 SCSI 命令 直接 传送 。FC-4 层 就 负责 处 理 这 些 细节 问题 。 


pp 信道 协议 网 络 协议 
上 层 协 议 (如 ， 因特网、 局 域 网 ) 
， 上 上层 协议 胸 射 
(上 层 协议 转换 成 通用 服务 命令 ) 
通用 服务 
(多 端口 的 设备 服务 ， 通 过 多 信道 分 带 ， 多 信道 广播 等 
Fc? 成 帧 、 由 流 控制 和 循环 仲 坊 Fe.ph 


ANS1x3.230 


FC- 编码 / 译 码 和 传输 协议 光纤 信道 物理 
和 信和 号 接口 


图 7A-9 光纤 信道 协议 堆栈 
FC-2 层 负责 生成 一 个 协议 包 〈 或 帧 ) ， 这 个 协议 包 中 包含 来 自 上 层 的 命令 或 数据 ， 或 者 是 来 自 下 
层 的 响应 和 数据 。 这 个 协议 包 的 大 小 固定 为 2148 字 节 ， 其 中 的 36 个 字 节 用 做 定 界 ， 路 由 安排 和 误差 
控制 ， 如 图 7A-10 所 示 。 





2112 数据 字 节 
"et ee 
指示 
数据 有 加 全 
~、 ”可 选择 帧 头 不 属于 光纤 信道 的 规范 部 分 ， 
7 ~~、 、 当 与 其 他 协议 接口 时 它 提供 兼容 性 。 





1 宇和 术 字 本 T 字 和 地 字 丰 一 


保留 源 地 址 。 六 
或 设备 1D 


图 7A-10 ”光纤 信道 协议 包 
当 FC-AL 通电 时 ，FC-AL 环 自身 会 进行 初始 化 。 这 时 ， 各 个 相关 的 设备 广播 他 们 自己 的 身份 ， 
相互 协商 设备 〈 端 口 ) 号， 并 且 会 选择 一 个 主 控 设备 。 然 后 ， 通 过 包 的 交换 发 生 数据 传输 。 
FC-AL 是 一 种 点 对 点 协议 ， 在 某 些 方面 与 SCSI 协议 相 类 似 。 如 果 只 有 两 个 节点 ， 即 只 有 发 起 者 和 
响应 者 ， 它 们 之 间 的 每 次 通信 都 可 以 使 用 总 线 。 当 发 起 者 想 使 用 总 线 时 ， 它 会 将 一 个 被 称 为 ARB (x) 的 
特殊 信号 放 到 总 线 上 。 这 就 是 说 设备 z 希望 仲裁 控制 总 线 。 如 果 此 时 没有 其 他 的 设备 控制 总 线 ， 那 么 环 
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上 的 每 个 节点 将 会 沿 着 逆 时 针 方向 逐次 将 ARB (x) 传 到 下 一 个 相 邻 的 节点 ， 直 到 这 个 数据 包 最 终 又 回 到 
发 起 者 。 当 发 起 者 看 到 自己 的 ARB (x) 在 总 线 上 没有 发 生变 化 时 ， 就 知道 它 已 经 赢得 了 总 线 的 控制 权 。 

如 果 在 这 个 环 上 有 另外 一 个 设备 控制 着 总 线 ， 那 么 在 返回 到 发 起 者 之 前 ，ARB (x) 包 将 会 被 改变 
成 一 个 ARB(F0) 包 。 此 后 ， 该 发 起 者 会 再 次 进行 尝试 。 如 果 同 时 有 两 个 设备 试图 取得 总 线 的 控制 权 ， 
那么 最 高 节点 数 的 设备 将 会 赢得 总 线 的 控制 权 ， 而 另外 的 设备 稍 后 会 重 试 。 

发 起 者 会 通过 接 通 与 响应 者 的 连接 来 宣称 自己 对 总 线 的 控制 。 这 一 过 程 通过 发 送 OPN (yy) (对 全 
双 工 而 言 ) 或 者 OPN (yx) (就 半 双 工 而 言 ) 命令 来 完成 。 直 到 接收 到 OPN (??) 命令 之 前 ， 响 应 者 会 
一 直 处 于 “准备 ”状态 ， 并 且 会 发 送 “ 接 收 器 就 绪 ” 命 令 来 通知 发 起 者 。 一 旦 数据 传输 完成 ， 发 起 者 
发 出 一 个 “关闭 (cLS)” 命 令 来 放弃 对 总 线 的 控制 权 。 

数据 传输 协议 的 细节 取决 于 在 环 路 或 光纤 中 应 用 的 服务 类 型 。 有 些 服务 类 型 要 求 对 发 送 的 数据 包 进 行 
确认 【要求 最 大 的 准确 性 )， 而 有 些 服务 类 型 却 并 不 要 求 对 发 送 的 数据 包 进 行 应 答 〈 要 求 最 大 的 传输 速度 ) 。 

目前 ， 对 于 光纤 信道 的 数据 传输 来 说 ， 定 义 了 5 种 服务 类 型 。 当 然 ， 并 不 是 所 有 服务 类 型 都 已 经 
在 真实 产品 上 得 到 了 实现 。 而 且 ， 如 果 没 有 足够 的 传输 带宽 可 用 ， 某 些 类 型 的 服务 可 以 混合 使 用 。 当 
传输 环 或 信道 没有 被 第 一 类 服务 占用 时 ， 有 些 具体 的 实现 过 程 允许 第 二 类 帧 和 第 三 类 帧 可 以 混合 进行 
传输 。 表 7A-3 归纳 总 结 了 目前 已 经 定义 的 光纤 信道 的 各 种 服务 类 型 。 表 7A-4 归纳 总 结 了 IEEE 1394、 
SSA 和 FC-AL 的 主要 特点 。 


表 7A-3 ”光纤 通道 的 不 同 服务 类 型 


带 有 数据 包 应 答 方式 的 专用 连接 服务 。 但 是 由 于 连接 管理 过 于 复杂 ， 所 以 这 种 服务 类 型 并 没有 得 到 许多 销 
售 商 的 支持 


类 似 于 第 一 类 服务 ， 但 并 不 要 求 专 用 连接 。 如 果 在 网 络 中 安排 不 同 的 传输 路 径 ， 数 据 包 可 以 在 信号 序列 的 

范围 外 进行 传送 。 第 二 类 服务 适合 于 低 通信 量 、 没 有 频繁 突 发 传输 的 装置 

无 连接 不 应 答 的 传输 服务 。 数 据 包 的 发 送 和 信号 排序 问题 由 上 层 协 议 进行 管理 。 在 具有 充分 带宽 的 小 型 网 

络 中 ,通常 这 种 传送 很 可 靠 。 利 用 该 协议 可 以 协商 获得 临时 的 信号 传输 通路 ， 所 以 非常 适合 于 FC-AL 

从 网 络 的 全 带宽 中 分 割 出 来 的 虚拟 电路 。 例 如 ， 一 个 100MB/s 的 网 络 可 以 支持 一 个 75MB/s 和 25MB/s 的 

连接 。 这 些 虚拟 电路 中 的 每 一 个 都 允许 有 不 同 的 服务 类 型 。 到 2002 年 ， 市 场 上 还 没有 商业 化 的 第 4 类 产品 

带 有 应 答 传 输 方式 的 从 一 个 信号 源 到 另 一 个 信号 源 的 多 信道 广播 。 对 于 音频 或 视频 广播 非常 有 用 。 为 了 防 
6 止 广播 节点 的 扩散 〈 如 果 对 广播 传输 采用 第 3 类 服务 的 话 将 会 发 生 节点 扩散 问题 ) ， 需 要 在 网 络 上 放置 一 

个 独立 的 节点 来 管理 广播 的 应 答 事 务 。 到 2002 年 为 止 ， 还 没有 第 6 类 产品 投入 市 场 








表 7A-4 一 些 SCSI-3 体系 结构 模型 的 速度 和 容量 
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7A.4 存储 器 的 区 域 网 络 
光纤 通道 技术 的 发 展 使 我 们 可 以 为 存储 器 的 访问 和 管理 来 构建 一 种 专用 的 网 络 。 这 种 网 络 称 为 存 
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储 器 的 区 域 网 络 (storage area networks，SAN) 。 从 逻辑 上 来 说 ，SAN 扩展 了 存储 器 的 局 域 总 线 ， 使 
得 一 组 大 量 的 存储 器 设备 的 集合 能 够 被 各 种 计算 机 的 平台 所 访问 ， 包 括 小 型 计算 机 、 中 型 计算 机 和 大 
型 计算 机 。 各 种 存储 器 设备 可 以 通过 多 个 主机 系统 来 进行 配置 安排 ， 或 者 将 这 些 存储 器 设备 用 作为 几 
英里 之 外 的 原始 操作 场所 的 “ 热 ” 备 份 系统 。 

与 网 络 连 接 的 存储 器 (network attached storage，NAS) 模型 相 比 ，SAN 可 以 更 方便 更 快速 地 访 
问 大 量 的 存储 器 。 在 一 个 典型 的 NAS 系统 中 ， 所 有 文件 的 访问 都 必须 通过 一 个 特殊 的 文件 服务 器 。 这 
样 可 能 会 产生 各 种 各 样 的 协议 管理 费用 ， 以 及 与 网 络 相 关 的 通信 拥塞 。 这 种 磁盘 访问 协议 (SCSI-3 体 
系 结构 模型 的 命令 ) 被 嵌 人 在 网 络 数 据 包 中 ， 会 造成 两 层 协议 的 管理 费用 和 对 数据 包 的 进行 编译 装配 / 
分 解 的 两 次 迭代 操作 过 程 。 

SAN 有 时 也 称 为 “网 络 背后 的 网 络 (the network behind the network)”， 它 与 普通 的 网 络 通信 是 
分 隔 开 来 的 。 光 纤 信 道 存储 器 网 络 〈 既 可 以 是 交换 式 的 ， 也 可 以 是 FC-AL) 潜在 地 要 比 NAS 系统 快 
很 多 ， 原因 是 光纤 信道 存储 器 的 网 络 只 有 一 个 协议 堆栈 来 控制 整个 网 络 系统 。 因 此 ， 它 们 避 开 了 使 用 
传统 的 文件 服务 器 ， 这 些 文件 骤 务 器 通常 可 能 会 成 为 网 络 通信 的 瓶颈 。 图 7A-11 和 图 7A-12 分 罚 给 出 
NAS 和 SAN 配置 结构 的 示意 图 作为 比较 。 
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图 7A-11 网 络 连 接 的 存储 器 (NAS) 
因为 SAN 独立 于 任何 特定 的 网 络 协议 (例如 Ethernet) 或 各 种 主机 的 专用 附属 协议 ， 所 以 我 们 
可 以 利用 任何 经 合理 配置 后 就 能 够 识别 SAN 存储 器 设备 的 平台 ， 通 过 SAM 的 上 层 协 议 很 方便 地 访问 
存储 器 的 区 域 网 络 。 而 且 ， 大 大 地 简化 了 存储 器 的 管理 ， 因 为 所 有 的 存储 器 都 位 于 一 个 SAN 网 络 上 。 
这 一 点 与 文件 服务 器 和 磁盘 阵列 不 同 。 我 们 可 以 通过 电子 传递 的 方法 ， 在 遥远 的 地 方 进行 数据 传输 ， 
或 者 将 数据 备份 到 一 个 磁带 上 ， 而 不 会 影响 到 网 络 或 主机 系统 的 工作 。 由 于 具有 高 速 、 灵 活 和 强大 的 
功能 ，SAN 可 以 提供 高 可 用 性 的 海量 存储 器 ， 正 成 为 大 用 户 社区 的 首选 系统 。 


7A.5 其 他 的 VO 连接 


还 有 大 量 的 1/O 体系 结构 不 属于 SCSI-3 体系 结构 模型 的 范围 ， 但 是 这 些 1/O 体系 结构 都 能 够 在 
某 种 程度 上 实现 与 SCSI 连接 。 其 中 AT 个 人 计算 机 附属 设备 的 IO 接口 最 为 流行 ， 这 种 IO 体系 结 
构 主 要 应 用 于 低 端 的 计算 机 系统 。 除 了 Intel 公司 的 范例 外 ， 为 计算 机 体系 结构 而 设计 的 其 他 一 些 
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图 7A-12 存储 器 的 区 域 网 络 (SAN) 


I/O 也 在 不 同类 型 的 计算 机 平台 上 得 到 了 广泛 的 应 用 。 在 接 下 来 的 部 分 ， 将 介绍 几 种 比较 流行 的 1/O 
连接 。 


7A.5.1 并 行 总 线 : 从 XT 到 ATA 


第 一 个 IBM PC 机 所 使 用 的 是 一 个 8 位 总 线 ， 称 为 PC/XT 总 线 。 这 种 总 线 为 IEEE 组 织 所 接纳 ， 并 
且 重 新 命名 为 行业 标准 体系 结构 (Industry Standard Architecture，ISA)。 最 初 该 总 线 工 作 速 度 为 
2. 38MB/s， 而 且 由 于 其 带宽 较 窗 ;所 以 访问 一 个 16 位 的 存储 地 址 就 需要 占用 两 个 时 钟 周期 。 因 为 XT 
运行 的 速度 为 4.77MHz， 所 以 XT 总 线 表 现 出 了 良好 的 性 能 。 随 着 配备 较 快 速 的 80286 处 理 器 的 PC/AT 
计算 机 的 出 现 ，8 位 的 总 线 显 然 已 经 不 能 再 用 。 最 直接 的 解决 办 法 是 将 总 线 拓 宽 到 16 位 数据 线 ， 增 加 
时 钟 频率 到 8MHz， 这 种 总 线 称 为 “AT 总 线 ”。 然 而 ， 不 久 以 后 ， 当 微 处 理 器 的 速度 开始 超过 25MHz 
时 ， 这 种 新 的 AT 总 线 就 成 了 一 个 非常 严重 的 系统 瓶颈 。 

在 接 下 来 的 几 年 内 , 市 场 上 出 现 多 种 解决 方案 。 这 些 解 决 方案 中 应 用 时 间 最 长 的 是 AT 总 线 的 变 
化 形式 ， 有 几 种 不 同 的 版 本 : 这 就 是 我 们 熟知 的 AT 附属 设备 (AT Attachment) 总 线 、ATAPI 总 线 、 
快速 ATA 总 线 和 EIDE 总 线 。 最 后 一 种 的 缩写 代表 的 是 增强 型 集成 驱动 器 电路 (Enhanced Integrated 
Drive Electronics)。 之 所 以 这 样 称呼 ， 是 因为 许多 原来 位 于 磁盘 驱动 器 接口 卡 上 的 控制 功能 现在 都 被 
集成 到 磁盘 驱动 器 本 身 的 控制 电路 之 中 。AT 附属 设备 总 线 能 够 向 下 兼容 16 位 的 AT 接口 卡 ， 同 时 对 
于 磁盘 驱动 器 和 其 他 的 设备 允许 连接 32 位 的 接口 。 外 部 设备 不 能 够 直接 连接 到 AT 附属 设备 总 线 上 ， 
而 内 部 设备 的 数量 限制 为 4。 根 据 所 使 用 的 是 编程 控制 的 1/O 还 是 DMA 控制 的 1/O 系统 ，AT 附属 设 
备 总 线 可 以 支持 22MB/s 或 16.7MB/s 的 传输 速率 ， 而 理论 上 的 最 大 传输 速率 为 66MB/s。 在 这 样 的 传 
输 速度 下 ，ATA 为 当今 市 场 上 的 小 型 计算 机 系统 提供 了 最 佳 性 价 比 的 总 线 系统 。 


7A. 5.2 外 围 设备 互 连 


到 1992 年 ，AT 总 线 已 经 变 成 了 制约 整个 小 型 计算 机 系统 的 性 能 的 主要 因素 。. 考 虑 到 AT 总 线 的 时 
代 即 将 结束 的 这 种 趋势 ，Intel 公司 开始 资助 一 个 行业 组 织 为 小 型 计算 机 系统 设计 一 种 更 快 更 灵活 的 W/O 
总 线 。 而 他 们 努力 的 结果 是 产生 了 外 围 设备 互 连 (Peripheral Component Interconnect，PCD 总 线 结构 。 

PCI 总 线 是 系统 数据 总 线 的 一 种 扩展 ， 它 能 够 取代 计算 机 系统 中 的 任何 其 他 的 I/O 总 线 。 当 PCI 
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在 一 个 CPU 字 的 全 带宽 条 件 下 ， 其 运行 速率 可 以 高 达 66MHz。 因 此 ， 对 于 一 个 32 位 的 CPU 来 说 ， 
理论 上 的 数据 吞吐 量 为 264MB/s 〈 即 ，66MHzX (32b/s 二 8bits/byte) 二 264MB/s)。 而 对 于 一 个 64 
位 运行 在 66MHz 时 钟 速率 的 PCI 总 线 ， 最 大 的 传输 速率 为 528MB/s。 尽 管 PCI 与 系统 总 线 相连 接 ， 
但 是 PCI 总 线 可 以 自行 协商 总 线 的 速度 和 数据 的 传输 ， 而 不 需要 CPU 的 干预 。PCI 总 线 既 快 又 灵活 。 
因此 ， 各 种 版 本 的 PCI 总 线 不 但 在 小 型 的 家 用 计算 机 中 使 用 ， 而 且 应 用 在 能 够 支持 实时 数据 获取 和 科 
学 研究 的 高 性 能 计算 机 系统 中 。 


7A.5.3 串 行 接口 : USB 


通用 串 行 总 线 (Universal Serial Bus，USB) 并 不 是 一 个 真正 意义 上 的 总 线 。 实 际 上 ，USB 只 是 
一 个 连接 微 处 理 器 扩充 总 线 的 串 行 外 围 接 口 ， 就 像 任 何其 他 的 扩充 卡 一 样 。 目 前 ， 第 二 代 的 USB 2.0 
版 本 ， 无 论 是 在 性 价 比 还 是 在 使 用 的 方便 性 方面 ， 都 要 超过 AT 附属 设备 总 线 ， 这 使 得 USB 接口 在 家 
用 计算 机 系统 的 应 用 领域 非常 具有 吸引 力 。USB 2. 0 的 设计 者 宣称 ， 他 们 的 产品 使 用 起 来 就 像 把 一 台 
电话 插 到 墙 上 的 插 孔 中 一 样 方便 。 

USB 需要 在 主机 系统 上 安装 一 个 叫做 根 集线器 (root hub) 的 适配器 卡 。 根 集线器 可 以 连接 一 个 或 
更 多 的 多 端口 集线器 ， 多 端口 集线器 能 够 直接 与 外 围 设备 相连 接 ， 其 中 包括 视频 照相 机 和 电话 等 。 而 多 
端口 集线器 可 以 进行 相互 的 级 联 ， 直 至 5 级 连接 。 一 个 单一 的 根 集线器 最 多 可 以 找 出 127 个 外 围 设备 。 

USB1. 1 的 主要 缺点 是 比较 慢 ， 速 度 仅 为 12MB/s。 这 样 的 数据 传输 速率 ，USB1. 1 与 那些 慢 速 的 
设备 的 配合 还 是 比较 好 的 ， 例 如 打印 机 、 键 盘 和 鼠标 等 。 但 是 ，USB1. 1 很 少 应 用 于 磁盘 系统 或 者 是 
同步 数据 的 传输 。USB2. 0 的 主要 改进 是 在 理论 上 它 的 最 大 数据 传输 速率 达到 480MB/s， 远 远 超过 了 
目前 的 桌面 型 计算 机 系统 的 需求 。USB 的 最 大 优点 是 功 耗 低 ， 非 常 适合 于 便携 式 计 算 机 系统 的 选择 。 


7A. 5.4 高 性 能 外 围 设 备 接口 : HIPPI 


在 宽带 系统 方面 主要 应 用 的 是 高 性 能 外 图 设备 接口 (High Performance Peripheral Interface， HIP- 
PT) 。HIPPI 是 以 千 兆 比特 速率 互 连 的 主机 系统 和 超 型 计算 机 的 ANSI 接口 标准 。1990 年 ，ANSI 
X3T11 技术 委员 会 发 布 了 第 一 套 HIPPI 规范 。 如 果 配 合适 当 的 硬件 系统 ，HIPPI 也 可 以 用 于 高 容量 的 
存储 器 接口 以 及 用 作 局 域 网 的 骨干 主 链 协议 。HIPPI 目前 最 大 的 传输 速度 为 100MB/s。 如 果 将 两 个 
100MB/s 的 连接 复 用 就 可 以 组 成 一 个 200MB/s 的 连接 。 为 HIPPI 制定 一 个 6. 4MB 比特 的 标准 目前 正 
在 研究 之 中 ， 这 个 新 的 HIPPI 标准 以 全 双 工 的 模式 运行 时 可 以 提供 1. 6MB 字 节 的 带宽 。 

人 们 常常 把 HIPPI 电缆 比 作 灭火 水 龙 带 ， 它 由 100 根 铜 导 线 组 成 ， 这 些 钢 导 线 为 50 对 相互 屏蔽 的 
双 绞 线 。 如 果 没 有 转发 器 ，HIPPI 能 够 沿 着 铜 导线 传输 大 约 150 英尺 (50 米 ) 的 距离 。 光 纤 HIPPI 连 
接 在 不 使 用 转发 器 的 情况 下 可 以 将 最 大 传输 距离 扩展 到 6 英里 (10km)， 具体 距离 还 要 取决 于 所 使 用 
的 光纤 类 型 。 作 为 大 量 并 行 的 计算 机 系统 的 一 种 并 行 互 连 的 设计 方案 ，HIPPI 可 以 与 许多 其 他 的 总 线 
和 协议 进行 互 连 ， 其 中 包括 PCI 和 SAM 总 线 。 


7A.6 小 结 


本 专题 概要 介绍 了 一 些 适用 于 各 种 大 型 和 小 型 计算 机 系统 的 流行 的 1/O 体系 结构 。 对 于 小 型 计算 机 系 
统 ， 适 用 的 1/0 体系 结构 有 : ATA、IDE、PCI、USB 和 IEEE 1394 等 ， 而 为 高 容量 的 大 型 计算 机 系统 设 
计 的 VO 体系 结构 有 ，HIPPI 和 某 些 SCSI- 3 协议 。SCSI - 3 的 体系 结构 模型 已 经 被 重新 定义 为 高 速 接口 。 
由 于 计算 机 和 存储 器 系统 具有 越 来 越 多 的 互 连 趋势 ， 所 以 SCSI- 3 的 体系 结构 模型 的 某 些 方面 已 经 覆盖 到 
了 数据 通信 的 领域 。 

光纤 信道 是 目前 应 用 在 服务 器 群 上 的 最 快 的 接口 协议 之 一 ， 而 其 他 的 一 些 协议 也 正在 开始 出 现 。 现 在 从 
“管理 存储 器 ”的 概念 中 开始 发 展 出 一 个 产业 来 ， 它 就 是 由 第 三 方 负责 为 客户 公司 进行 短期 的 和 长 期 的 磁盘 存 
储 器 管理 。 我 们 可 以 预期 这 种 外 判 的 服务 领域 能 够 继续 发 展 壮 大 ， 带 来 更 多 的 新 思想 、 协 议和 体系 结构 。 
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练习 题 


1 


$5. 


. 本 节 所 讨论 的 娜 一 种 类 型 的 存储 器 体系 结构 能 够 在 大 型 的 数据 中 心 或 服务 器 群 上 找到 ? 如 果 在 数据 中 心 


的 环境 中 ， 使 用 其 他 类 型 的 一 种 体系 结构 会 出 现 什么 问题 ? 


. 在 仲裁 阶段 完成 后 ， 会 有 多 少 个 SCSI 设备 被 激活 ? 
. 假如 在 异步 并 行 SCSI 数据 的 传输 过 程 中 ， 有 人 从 预定 的 传输 对 象 的 驱动 器 中 移 走 一 个 软盘 。 在 下 面 的 


这 些 阶段 ， 启 动 设 备 是 如 何 知道 发 生 了 错误 ? 


”总 线 空 闲 ”状态 
”选择 。 消息 
”命令 ， 重新 选择 
"数据 


a) 如 果 数 据 传输 是 “ 写 ” 操 作 ， 那 么 在 上 面 的 哪个 阶段 有 可 能 将 好 的 数据 写 到 软盘 上 ? 
b) 如 果 数 据 传输 是 “ 读 ” 操 作 ， 那 么 又 在 上 面 的 那 一 个 阶段 ， 系 统 会 有 好 的 数据 存放 在 缓冲 器 中 吗 ? 
系统 会 对 该 数据 进行 确认 吗 ? 


, 假定 你 的 经 理 决 定 用 一 个 高 速 和 宽带 的 SCSI-3 适配器 取代 原来 老 的 SCSL2 主机 适配器 ， 来 改善 文件 服 


务 器 的 吞吐 量 。 她 还 决定 用 一 些 比 原来 大 得 多 的 高 速 和 宽带 SCSI-3 驱动 器 来 替换 老 的 SCSL2 驱动 器 。 
当 将 所 有 的 文件 从 老 的 SCSI-2 驱动 器 上 移 到 新 的 SCSI-3 驱动 器 上 之 后 ， 你 又 对 原来 老 的 SCSL2 驱动 器 
进行 了 格式 化 ， 以 便 它们 还 可 以 在 其 他 地 方 重新 使 用 。 当 完成 这 一 切 时 ， 你 的 经 理 告 诉 你 把 老 的 SCSI-2 
驱动 器 留 在 服务 器 中 ， 因 为 她 知道 SCS1-2 是 向 下 和 SCSI-3 兼容 的 。 作 为 一 个 好 的 员工 ， 你 会 按照 经 理 
的 孙 求 去 做 。 然 而 ， 风 天 以 后 ，SCSI-3 的 升级 并 没有 取得 经 理 所 期 望 的 系统 性 能 的 改进 。 对 于 经 理 的 失 
望 ， 你 一 点 都 不 觉得 惊奇 。 到 底 发 生 什么 样 的 情况 ?你 可 以 如 何 来 解决 这 个 问题 ? 

你 刚刚 将 系统 升级 为 一 个 高 速 和 宽带 的 SCSI-3 接口 。 系 统 带 有 一 个 软盘 驱动 句 ， 一 个 CD-ROM 和 8GB 
的 硬盘 驱动 器 。 请 问 主机 适配器 的 设备 号 是 多 少 ? 为 什么 ? 


.SCSI-2 与 SCSL3 体系 结构 模型 的 原理 有 何不 同 ? 
.SCSI3 体系 结构 的 模型 为 计算 机 和 外 围 设 备 制造 厂商 带 来 了 哪些 方面 的 好 处 ? 
. 假设 你 现在 要 设计 一 个 连接 许多 计算 机 和 摄像 机 的 视频 会 议 系 统 。 你 会 选择 娜 种 接口 模型 ? 用 于 传输 视 


频 的 协议 包 和 用 于 传输 数据 的 协议 包 是 否 完全 相同 ”有 什么 样 的 协议 内 容 是 包含 在 其 中 的 一 个 协议 包 
内 ， 而 在 另外 一 个 协议 包 中 却 是 没有 的 ? 


. 一 个 SSA 总 线 的 配置 是 如 何 从 单 磁盘 失效 的 故障 中 恢复 数据 的 ? 假设 在 第 一 个 节点 修复 之 前 ， 另 一 个 节 


点 又 发 生 失 效 故 障 ， 这 时 系统 该 如 何 完成 恢复 任务 ? 


10. 假设 你 现在 被 分 配 到 一 个 工作 小 组 ， 任 务 是 在 化 学 工厂 里 安装 自动 化 控制 系统 ， 要 将 几 百 个 传感器 放 


置 于 遍及 整个 工厂 厂区 的 储 液 桶 、 和 负 和 容器 之 中 。 从 传感器 送 回 的 所 有 数据 都 会 被 输入 到 一 组 功能 强 
大 的 计算 机 中 ， 以 便 值 班 经 理 和 管理 人 员 能 够 监视 和 控制 生产 的 各 个 过 程 。 你 准备 在 传感器 和 计算 机 
之 间 使 用 哪 神 类 型 的 接口 ? 如 果 所 有 的 计算 机 都 要 求 能 够 访问 所 有 的 传感器 输入 ， 那 么 对 于 各 个 计算 
机 之 间 互 连 ， 你 是 否 会 使 用 同一 种 类 型 的 连接 ? 你 会 使 用 哪 一 种 7O 控制 模式 ? 


. 假设 现在 有 一 个 工程 师 提议 要 改变 公司 制造 的 计算 机 系统 的 总 线 体系 结构 。 她 声称 如 果 修 改 后 的 总 线 


可 以 直接 支持 网 络 协议 ， 那么 计算 机 系统 就 不 再 需要 配备 网 络 接口 卡 。 她 还 宣称 这 样 可 以 取消 SAN， 
而 将 客户 的 计算 机 直接 连接 到 磁盘 阵列 上 。 你 会 反对 这 个 建议 吗 ? 请 解释 原因 。 





程序 就 是 在 计算 机 上 进行 的 一 种 拼写 转换 ， 将 输入 变 成 错误 信息 。 
一 无名氏 


第 8 章 系统 软件 


8.1 概述 


在 工作 中 ， 我 们 常常 会 遇 到 这 样 的 情形 : 由 于 只 有 某 类 机 器 才能 运行 公司 要 求 的 特殊 软件 ， 所 以 
我 们 不 得 不 购买 不 是 最 理想 的 计算 机 硬件 。 虽 然 这 与 我 们 的 更 佳 判 断 事与愿违 ， 但 是 我 们 必须 意识 到 
一 个 完整 的 计算 机 系统 不 仅 要 有 硬件 还 需要 有 软件 的 支持 。 软 件 是 一 个 窗口 ， 用 户 需 要 通过 这 一 窗口 
与 计算 机 系统 进行 对 话 。 不 管 计算 机 硬件 设备 如 何 精良 ， 但 是 如 果 软 件 不 能 够 按照 用 户 的 期 望 提供 服 
务 ， 那 么 人 们 还 是 会 认为 整个 系统 是 不 合乎 要 求 的 。 

在 第 1 章 中 ， 我 们 介绍 了 计算 机 由 6 个 不 同 的 机 器 层次 组 成 ， 其 中 门 电 路 层 上 面 的 每 一 层 都 为 其 
层 提 供 一 种 抽象 。 在 第 4 章 中 ， 我 们 讨论 了 汇编 程序 以 及 汇编 语言 与 计算 机 体系 结构 之 间 的 相互 关系 。 
本 章 将 学 习 在 计算 机 体系 结构 的 第 三 层 中 应 用 的 软件 ， 并 将 这 些 思想 与 位 于 第 四 层 和 第 五 层 的 软件 联 
系 在 一 起 。 所 有 这 三 个 层次 的 软件 集合 都 运行 在 应 用 程序 的 下 面 ， 并 且 恰 好 就 在 指令 系统 结构 层 的 上 
面 。 利 用 这 三 个 层次 的 软件 的 集合 ,“ 机 器 ”和 用 户 应 用 程序 的 源 代码 之 间 就 可 以 进行 交互 。 这 三 个 层 
次 中 的 程序 一 起 协同 工作 ， 提 供 了 对 用 来 执行 应 用 程序 中 各 种 命令 的 硬件 资源 的 访问 。 但 是 ， 如 果 我 
们 只 是 将 计算 机 系统 看 作 从 应 用 程序 源 代码 直接 运行 到 门 电路 层 的 单一 线程 ， 则 会 严重 限制 我 们 对 计 
算 机 系统 的 理解 。 同 时 ， 我 们 也 会 忽略 掉 计算 机 体系 机 构 中 每 一 层次 能 够 为 用 户 提 供 的 丰富 服务 。 

尽管 在 这 里 的 计算 机 系统 模型 中 ， 只 是 把 操作 系统 放 在 “系统 软件 ” 层 上， 但 是 系统 软件 的 内 容 
通常 还 包括 编译 器 和 其 他 一 些 实用 程序 (或 称 为 工具 ，utility)， 以 及 一 类 有 时 称 为 中 间 件 (miiddle- 
ware) 的 复杂 程序 。 一 般 来 说 ， 中 间 件 是 一 种 广义 分 类 ， 是 指 位 于 操作 系统 之 上 和 应 用 程序 之 下 的 服 
务 性 软件 。 大 家 可 以 回忆 一 下 ， 在 第 1 章 中 我 们 讨论 了 有 关 在 物理 元 件 与 高 层 请 言及 应 用 程序 之 间 存 
在 语义 间隙 。 我 们 知道 用 户 无 法 感知 这 种 语义 间 险 ， 中 间 件 是 提供 这 种 必需 的 不 可 见 性 的 中 间 软 件 。 
操作 系统 是 所 有 系统 软件 的 基础 ， 所 以 所 有 系统 软件 实际 上 都 与 操作 系统 发 生 一 定 程 度 的 交互 作用 。 
我 们 先 简单 介绍 操作 系统 的 内 部 工作 方式 ， 然 后 再 讨论 一 些 更 高 的 软件 层 。 - 


8.2 操作 系统 


最 初 ， 操 作 系统 的 主要 作用 是 帮助 各 种 应 用 程序 与 计算 机 硬件 进行 交互 。 操 作 系 统 提供 了 一 组 计 
算 机 所 必需 的 功能 ， 允 许 软件 包 控 制 计算 机 硬件 。 如 果 计 算 机 没有 操作 系统 ， 那 么 所 运行 的 每 个 程序 
都 需要 有 自己 的 显卡 驱动 程序 、 声 卡 驱 动 程序 、 硬 盘 驱 动 程序 ， 等 等 。 

虽然 现代 操作 系统 仍 执行 此 功能 ， 但 用 户 对 操作 系统 的 期 望 已 有 了 相当 大 的 变化 。 人 们 设想 操作 
系统 能 够 使 系统 管理 和 资源 管理 更 容易 。 这 种 期 望 催生 了 “ 拖 放 (drag and drop) 式 ” 的 文件 管理 和 
“ 即 插 即 用 (plug and play)” 的 设备 管理 。 从 程序 员 的 角度 来 看 ， 操 作 系统 隐藏 了 计算 机 系统 中 较 低 体 
系 结构 层次 的 细节 问题 ， 而 使 用 户 的 注意 力 能 够 集中 到 解决 高 层次 问题 上 。 我 们 已 经 看 到 ， 要 在 机 器 
语言 和 汇编 语言 的 层次 上 进行 编程 是 一 件 非 常 困难 的 事情 。 操 作 系 统 与 大 量 软件 协同 工作 ， 创 建 了 一 
个 可 以 有 效 且 高 效 利用 系统 资源 的 友好 环境 ， 在 这 种 环境 下 无 需 再 使 用 机 器 代码 编程 。 操 作 系 统 不 仅 
为 程序 员 提 供 了 这 样 一 个 编程 接口 ， 而 且 充当 了 应 用 软件 与 机 器 实际 硬件 之 间 的 中 间 层 。 无 论 是 从 用 
户 还 是 从 应 用 程序 代码 行 的 角度 来 看 ， 操 作 系 统 在 本 质 上 都 是 提供 了 从 硬件 到 软件 接口 的 虚拟 机 器 。 
操作 系统 负责 处 理 实际 的 设备 和 硬件 ， 这 样 用 户 和 应 用 程序 则 无 需 关心 此 工作 。 
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操作 系统 本 身 只 是 一 段 普通 的 计算 机 程序 。 它 与 其 他 大 多 数 软件 的 区 别 在 于 ， 操 作 系 统 在 计算 机 
启动 时 就 会 被 装 入 ,并且 由 处 理 器 直接 执行 。 因 为 操作 系统 的 一 项 重要 任务 是 CPU 的 进程 调度 ， 所 以 
操作 系统 必须 能 够 控制 处 理 器 和 其 他 一 些 资 源 。 对 于 各 种 应 用 程序 来 说 ， 在 应 用 程序 执行 期 间 ， 操 作 
系统 会 放弃 对 CPU 的 控制 。 当 应 用 程序 不 再 请 求 CPU， 或 者 是 因为 要 等 待 其 他 资源 而 放弃 CPU 时 ， 
操作 系统 可 以 依靠 处 理 器 重新 获得 对 CPU 的 控制 权 。 

前 面 已 经 提 到 ， 对 于 用 户 和 应 用 程序 来 说 ， 操 作 系统 是 到 底层 的 硬件 的 一 个 重要 接口 。 除 了 作为 
接口 之 外 ， 操 作 系统 还 有 三 大 主要 任务 。 进 程 管理 也 许 是 这 三 项 工作 中 最 令 人 感 兴趣 的 任务 ， 其 他 两 
项 任务 包括 系统 资源 管理 和 保护 系统 资源 不 受 错误 进程 的 影响 。 在 讨论 这 些 任务 之 前 ， 我 们 先 来 回顾 
一 下 操作 系统 的 发 展 历史 ， 看 一 看 操作 系统 是 怎样 随 着 计算 机 硬件 的 演变 过 程 而 发 展 的 。 


8.2.1 操作 系统 的 发 展 史 


今天 的 操作 系统 提供 了 丰富 的 图 形 处 理工 具 ， 力求 做 到 不 论 是 新 手 还 是 专业 用 户 都 能 够 轻松 地 使 
用 计算 机 。 但 是 在 过 去 ， 情 况 却 并 非 如 此 。 几 乎 在 这 一 代 计算 机 之 前 ， 计 算 机 的 资源 非常 宝贵 ， 每 个 
机 器 周期 都 要 用 来 完成 一 些 有 用 的 工作 。 由 于 计算 机 硬件 的 价格 过 高 ， 人 们 对 于 计算 机 中 的 时 间 分 配 
问题 极为 小 心 。 当 时 ， 要 使 用 计算 机 首先 要 登记 上 机 时 间 。 上 机 时 得 自己 装 人 程序 的 穿孔 卡片 。 机 器 
的 运行 是 采用 单 用 户 与 人 机 对 话 的 模式 。 然 而 ， 在 装 人 程序 之 前 ， 必 须 先 在 机 器 上 装 人 程序 的 编译 器 。 
在 变 输 入 的 卡片 组 中 ， 最 前 面 的 一 组 卡片 中 包含 引导 装 和 程序， 这 个 程序 将 负责 完成 其 他 剩余 的 卡片 
装 人 工作 。 此 后 ， 需 要 对 程序 进行 编译 。 如 果 程 序 代码 中 有 错误 ， 必 须 迅 速 找到 错误 ， 并 对 出 错 的 卡 
片 重新 打 孔 。 然 后 ， 再 将 卡片 组 重新 装 人 计算 机 ， 并 尝试 另 一 次 编译 。 如 果 不 能 及 时 找到 程序 的 出 错 
位 置 ， 需 要 另外 再 登记 时 间 等 到 下 次 再 来 尝试 。 一 旦 程序 编译 完成 ， 接 下 来 的 工作 就 是 链接 结果 代码 
和 库 代 码 文件 ， 生 成 实际 运行 的 可 执行 文件 。 显 然 ， 这 一 过 程 对 于 昂贵 的 计算 机 系统 和 操作 人 员 的 时 
间 来 说 ， 都 是 一 种 可 怕 的 浪费 。 为 了 让 更 多 的 人 可 以 使 用 计算 机 硬件 设备 ， 人 们 引入 了 批 处 理 〈batch 
processing) 。 

利用 批 处 理 ， 专 业 的 操作 员 会 将 多 个 的 卡片 组 整合 成 若干 批 ， 或 称 为 捆 (bundle)。 利 用 合适 的 指 
令 可 以 让 这 些 成 批 的 卡片 在 最 短 的 时 间 间 取 内 完成 卡片 的 处 理工 作 。 通 常 这 些 分 批 的 卡片 都 记录 一 些 
类 型 相似 的 程序 。 例 如 ， 可 能 一 批 卡片 记录 的 是 FORTRAN 程序 ， 而 接着 的 一 批 是 COBOL 程序 。 这 
样 一 来 ， 操 作 员 就 可 以 先 将 机 器 设置 为 FORTRAN 程序 的 工作 模式 ， 读 取 并 执行 完成 全 部 FOR- 
TRAN 程序 。 然 后 ， 再 将 机 器 切换 为 COBOL 模式 。 为 此 ， 人 们 设计 了 一 种 称 为 常 驻 监控 程序 《resi- 
dent monitor) 的 程序 。 常 驻 监督 程序 允许 机 器 在 无 人 工 于 预 的 情况 下 处 理 各 种 程序 ， 不 同 于 将 卡片 组 
输入 到 读 卡 器 再 进行 人 工 编译 的 过 程 。 

常 驻 监控 程序 实际 上 是 现代 操作 系统 的 前 身 ， 它 的 功能 非常 简单 ， 即 由 监控 程序 启动 程序 任务 ， 
并 将 计算 机 的 控制 权 交 给 该 任务 。 当 任务 完成 后 ， 监 控 程 序 又 重新 接管 机 器 的 控制 权 。 常 驻 监 控 程 序 
将 这 些 原来 的 人 工 工作 交 给 计算 机 来 处 理 ， 从 而 大 大 增加 了 系统 的 工作 效率 和 实用 性 。 然 而 ， 作 者 还 
记得 ,完成 这 种 批 处 理 任务 所 花费 的 周转 时 间 是 相当 长 的 。 我 们 还 能 够 回忆 起 早先 那些 呆 在 数据 中 心 
收拾 成 堆 的 要 处 理 的 汇编 语言 卡片 的 痛苦 日 子 。 有 了 时， 我 们 得 胆战心惊 地 等 上 差不多 24 小 时 才能 取 回 
运算 结果 。 批 处 理 的 工作 方式 使 得 调试 变 得 更 加 困难 ， 或 者 更 加 准确 地 说 是 非常 耗 时 。 有 时 ， 程 序 中 
的 一 个 死 循环 就 可 能 在 系统 中 造成 严重 破坏 。 后来， 人 们 在 监控 程序 中 增加 了 一 个 计时 器 ， 以 防止 某 
个 进程 独占 整个 系统 。 然 而 ， 监 控 程 序 的 作用 由 于 没有 提供 额外 的 保护 而 受到 了 很 大 限制 。 由 于 没有 
保护 ， 一 个 批 作业 任务 可 能 会 影响 正在 等 候 的 批 任务 。 例 如 : 一 个 “ 坏 ” 作 业 任 务 可 能 会 因为 读 取 了 
过 多 的 卡片 ， 而 致使 下 一 个 程序 也 发 生 错误 。 此 外 ， 批 作业 任务 甚至 还 可 能 会 影响 到 监控 程序 的 程序 
代码 。 为 了 解决 这 一 问题 ， 人 们 在 计算 机 系统 中 设计 了 专门 的 硬件 ， 允 许 计 算 机 题 可 以 在 用 户 模 式 下 
工作 ， 也 可 以 在 监控 程序 模式 下 工作 。 当 程序 在 用 户 模 式 下 运行 时 ， 如 果 有 某 个 系统 调用 的 需要 ， 就 
可 以 将 系统 切换 到 监控 程序 的 工作 模式 。 
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随 着 CPU 性 能 的 不 断 提高 ， 这 种 依靠 打 孔 卡片 的 批 处 理 方式 的 工作 效率 显得 越 来 越 低 。 读 卡 器 已 
经 不 能 再 保持 CPU 一 直 处 于 忙碌 的 工作 状态 。 使 用 磁带 为 更 快 地 处 理 程序 卡片 的 任务 提供 了 一 种 新 的 
方法 。 人 们 将 读 卡 器 和 打印 机 都 连接 到 小 型 计算 机 系统 上 ， 这 种 小 型 计算 机 负责 把 卡片 组 上 面 的 数据 
读 取 到 磁带 上 。 一 条 磁带 可 以 包含 多 项 作业 任务 。 这 样 ， 主 机 CPU 无 需 读 卡 即 可 继续 在 不 同 程序 进程 
中 进行 切换 。 对 于 计算 机 的 输出 也 可 以 使 用 类 似 的 操作 过 程 。 首 先 将 输出 结果 写 到 磁带 上 ， 然 后 再 将 
磁带 上 的 结果 转移 到 小 型 计算 机 上 ， 最 后 利用 小 型 计算 机 完成 实际 打印 输出 。 监 控 程序 必须 定期 检查 
计算 机 是 否 需 要 I/O 操作。 在 各 种 作业 任务 中 都 需要 加 入 一 个 计时 器 ， 这 样 允许 产生 一 些 短暂 的 中 断 
过 程 ， 让 监控 程序 有 时 间 将 正在 等 候 的 1/O 发 送 到 磁带 设备 。 这 样 一 来 ，1/O 操作 和 CPU 的 计算 就 可 
以 并 行 发 生 。 这 种 处 理 方式 在 60 年 代 末 到 70 年 代 末 期 间 非 常 流 行 ， 被 称 为 外 国 设 备 联机 并 发 操作 
(Simultaneous Peripheral Operation Online， 简 称 SPOOLing)， 这 是 多 道 程序 处 理 的 一 种 最 简单 的 形 
式 。SPOOLing 这 个 词 也 被 收录 到 计算 机 词典 中 ， 但 是 这 个 单词 现在 的 意义 是 指 假 脱 机 技术 ， 即 打印 
输出 的 数据 在 送 到 打印 机 之 前 要 先 写 到 磁盘 上 。 

60 年 代 末 期 创建 的 并 且 一 直 沿 用 至 今 的 多 道 程序 处 理 系统 (multiprogramming system) 则 扩充 了 
spooling 和 批 处 理 的 思想 ， 允 许多 个 程序 同时 在 存储 器 (内 存 ) 中 并 发 执行 。 这 种 并 发 处 理 是 通过 在 
程序 进程 之 问 进行 轮流 切换 来 实现 的 。 这 里 ， 计 算 机 安排 每 个 程序 进程 在 某 个 特定 时 间 段 内 使 用 
CPU。 监 控 程 序 可 以 在 一 定 范围 内 处 理 多 道 程序 的 操作 。 监 控 程 序 可 以 启动 各 种 作业 任务 ， 实 现 假 脱 
机 ， 执 行 VO 操作， 在 不 同 用 户 任务 之 间 进 行 切 换 ， 以 及 在 不 同 任务 之 间 提 供 某 种 保护 。 然 而 ， 随 着 
监控 程序 的 任务 变 得 越 来 越 复杂 ， 我 们 需要 有 更 加 精巧 复杂 的 软件 。 监 控 程 序 正 是 从 此 时 开始 演变 发 
展 成 为 我 们 现在 所 熟知 的 操作 系统 (operating system) 。 

尽管 操作 系统 减轻 了 程序 设计 人 员 和 计算 机 操作 人 员 大 量 繁重 的 工作 ， 但 是 用 户 总 是 希望 能 够 与 
计算 机 进行 更 加 密切 的 交流 。 尤 其 是 单纯 的 批 处 理 作业 并 不 是 非常 具有 吸引 力 。 如 果 用 户 能 够 通过 人 
机 对 话 向 计算 机 系统 提交 任务 并 且 得 到 立即 反馈 ， 岂 不 是 一 件 非常 好 的 事情 ? 分 时 共享 的 计算 机 系统 
(time-sharing system) 就 实现 了 这 样 的 功能 。 分 时 共享 的 计算 机 系统 连接 多 个 用 户 终 端 ， 允 许多 个 用 
户 同时 进行 访问 。 因 为 交互 式 的 编程 促进 了 分 时 技术 (也 称 为 时 间 分 割 技 术 ) 的 发 展 ， 所 以 批 处 理 技 
术 很 快 就 过 时 了 。 在 一 个 分 时 共享 的 计算 机 系统 中 ，CPU 通过 依次 分 配给 每 个 用 户 一 个 小 段 的 处 理 时 
间 ， 在 与 之 对 话 的 各 个 用 户 之 间 进 行 快速 切换 。 这 种 切换 过 程 称 为 关联 转换 (或 称 为 现场 切换 ，con- 
text switching) 。 从 本 质 上 来 说 ， 操 作 系 统 执行 这 种 关联 转换 的 速度 非常 快 ， 这 样 就 为 各 个 用 户 提 供 了 
一 台 个 人 的 虚拟 计算 机 。 

分 时 技术 允许 许多 用 户 共 享 同一 个 CPU。 将 这 种 思想 拓展 开 来 ,计算机 系统 也 能 够 让 许多 用 户 共 
享 一 个 应 用 程序 。 大 型 的 交互 式 系 统 ， 例 如 飞机 的 机 票 预定 系统 ， 就 要 同时 为 成 百 上 千 的 客户 服务 。 
因为 使 用 了 分 时 系统 ， 大 型 交互 式 系 统 的 用 户 并 不 知道 在 系统 上 同时 还 有 其 他 用 户 。 

引入 多 道 程序 处 理 和 分 时 技术 需要 有 更 复杂 的 操作 系统 软件 。 在 一 个 关联 转换 过 程 中 ， 所 有 当前 
正在 执行 的 程序 的 相关 信息 都 必须 保存 起 来 ， 以 便 各 个 程序 进程 被 安排 到 再 次 使 用 CPU 时 可 以 恢复 到 
先前 中 断 时 的 确切 状态 。 这 要 求 操 作 系 统 知道 所 有 的 硬件 细节 问题 。 大 家 记得 ， 在 第 6 章 中 我 们 介绍 
了 在 现代 的 计算 机 系统 中 都 会 使 用 虚拟 存储 器 和 分 页 技术 。 在 一 个 关联 转换 的 过 程 中 ， 页 天 和 其 他 与 
虚拟 存储 器 有 关 的 信息 都 必须 保存 起 来 。CPU 的 寄存 器 中 的 内 容 在 关联 转换 发 生 时 也 必须 保存 ， 内 为 
这 些 寄存 器 包含 正在 执行 程序 进程 当前 的 状态 信息 。 这 种 关联 转换 在 资源 或 时 间 上 都 有 很 大 开销 。 为 
了 使 得 这 种 操作 变 得 有 价值 ， 操 作 系统 必须 快速 和 高 效 地 处 理 这 些 关 联 转换 。 

有 趣 的 是 ， 我 们 发 现 操作 系统 的 演变 和 计算 机 体系 结构 的 发 展 进步 有 着 非常 密切 的 联系 。 第 一 代 
计算 机 使 用 的 是 真空 管 和 继电器 ， 运 算 速度 非常 慢 。 因 此 ， 当 时 的 计算 机 实际 上 就 没有 必要 有 操作 系 
统 ， 因 为 这 些 机 器 并 不 能 处 理 多 个 并 发 任务 。 所 需 的 任务 管理 事务 由 操作 人 员 来 执行 。 第 二 代 计 算术 
使 用 晶体 管 ， 在 速度 和 CPU 处 理 能 力 上 都 有 较 大 提高 。 虽 然 CPU 的 处 理 能 力 增强 了 ， 但 是 这 种 计算 
机 价格 仍然 非常 昂贵 ， 所 以 人 们 总 是 希望 能 够 最 大 限度 地 利用 它们 的 功能 。 这 时 引进 了 批 处 理 的 工作 
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方式 ， 以 提高 CPU 的 利用 率 。 监 控 程 序 可 以 帮助 完成 这 种 处 理 操作 ， 提 供 最 小 的 保护 和 中 断 处 理 。 集 
成 电路 的 应 用 是 第 三 代 计算 机 的 标志 。 同 样 ， 集 成 电路 也 使 得 计算 机 处 理 速 度 大 幅 提 高 。 这 时 ， 单 独 
的 spooling 技术 已 经 不 能 保证 CPU 高 效 工作 ， 因 此 产生 了 分 时 技术 。 虚 所 存储 器 和 多 道 程序 处 理 要 求 
有 一 个 更 加 复杂 精巧 的 监控 程序 ， 这 种 监控 程序 发 展 成 为 现在 的 操作 系统 。 第 四 代 计 算 机 技术 ，VL- 
SI， 使 得 个 人 计算 机 的 市 场 莲 勃 发 展 。 网 络 操作 系 统 和 分 布 式 操作 系统 正 是 这 种 技术 发 展 的 产物 。 电 
路 的 最 小 化 也 大 大 减少 了 CPU 在 芯片 上 所 占用 的 空间 ， 这 样 可 以 在 芯片 上 集成 更 多 的 电路 来 管理 流水 
线 、 数 组 〈 阵 列 ) 操作 和 多 道 程序 处 理 等 。 
et 计算 机 生产 商 们 经 常 针对 一 个 特定 的 硬件 平台 生产 出 一 
或 者 多 个 专用 的 操作 系统 。 个 计算 机 的 制造 厂商 为 不 同 平台 设计 的 操作 系统 在 系统 操作 和 它们 所 
提供 的 服务 上 能 是 完全 不 同 的 在 那个 时 候 ， 当 一 种 新 型 计算 机 出 现时 ， 生 产 厂 商 引 进 一 种 新 的 操 
作 系 统 是 一 件 非常 普通 的 事情 。 直 到 20 世纪 60 年 代 中 期 ，IBM 公司 引入 360 系列 计算 机 时 才 基 本 上 
结束 了 上 述 的 这 种 局 面 。 尽 管 360 家 族 中 的 每 台 计 算 机 在 性 能 上 相差 很 大 ， 但 是 所 有 的 计算 机 都 运行 
同一 个 基本 的 操作 系统 ，OS/360。 
Unix 是 另外 的 一 个 操作 系统 ， 它 也 是 一 种 操作 系统 可 以 跨越 多 个 硬件 平台 的 设计 思想 的 范例 。 美 

国电 话 电报 公司 (AT&T) 员 尔 实验 室 的 汤普森 (Ken Thompson) 从 1969 年 开始 致力 于 Unix 操作 系 
. 统 的 研究 开发 工作 。 汤 普 森 最 初 利用 汇编 语言 来 编写 Unix。 但 是 由 于 汇编 语言 是 硬件 专用 的 诸 言 ， 

一 种 硬件 平台 下 编写 的 任何 程序 代码 ， 对 于 另 一 种 硬件 平台 来 说 都 必须 重 写 和 重新 进行 汇编 。 汤 普 森 
想到 对 于 每 一 种 不 同 机 器 都 需要 重新 编写 Unix 操作 系统 ， 感 觉 非常 注 丧 。 抱 着 希望 威 轻 未 来 劳动 的 想 
法 ,汤普森 创造 了 一 种 称 为 B 语 言 的 新 的 高 级 语言 。 然 而 ， 要 支持 操作 系统 的 各 种 活动 ，B 语言 的 速 
度 实在 是 太 慢 了 。 里 奇 (Dennis Ritchie) 随后 也 加 入 和 汤普森 一 起 开发 C 编程 语言 ， 并 在 1973 年 发 布 
了 第 一 个 C 语 言 的 编译 器 。 汤 普 森 和 里 奇 利用 C 语言 重 写 Unix 操作 系统 ， 从 此 根除 了 操作 系统 一 定 
要 用 汇编 语言 来 编写 的 这 个 信条 。 因 为 Unix 是 用 高 级 语言 编写 的 ， 所 以 Unix 能 够 在 不 同 硬 件 平台 进 
行 编译 , 也 就 是 说 Unix 具有 很 强 的 可 移植 性 。 这 种 与 传统 操作 系统 的 主要 区 别 使 得 Unix 操作 系统 非 
常 流行 。 虽 然 Unix 进入 市 场 的 步伐 比较 缓慢 ， 但 是 现在 选择 使 用 Unix 的 用 户 已 经 达到 了 几 百 万 。 
Unix 所 表现 出 来 的 与 硬件 无 关 的 特性 ， 人 允许 用 户 为 他 们 的 应 用 程序 选择 最 佳 的 硬件 设备 ， 而 不 会 局 限 
于 某 个 特定 的 硬件 品 平 台 。 现 在 从 文字 上 统计 就 有 几 百 种 不 同 风格 的 Unix 操作 系统 ， 其 中 包括 Sun 公 
司 的 Solaris，IBM 公司 的 AIX ，HP 公司 (Hewlett-Packard) 的 HP-UX， 以 及 为 PC 机 和 服务 器 设计 
的 Linux。 





在 最 近 几 年， 对 于 操作 系统 的 设计 人 员 来 说 ， 最 大 的 挑战 可 能 就 是 引入 了 实时 、 多 处 理 器 、 分 布 / 
网 络 系统 。 实 时 系统 (Real-time system) 主要 用 于 制造 工厂 的 生产 过 程控 制 、 装 配 线 、 机 器 人 技术 ， 
以 及 类 似 空间 工作 站 这 样 的 复杂 物理 系统 。 当 然 ， 这 里 列举 的 只 是 少数 几 个 例子 。 实 时 系统 有 非常 严 
格 的 时 间 限 制 。 如 果 不 能 满足 特定 的 时 间 了 限制， 就 有 可 能 造成 物理 上 的 损坏 , 或 者 是 其 他 人 力 或 物力 
损失 。 因 为 这 些 实时 系统 必须 对 外 部 事件 做 出 反应 ， 所 以 正确 的 进程 调度 是 问题 的 关键 。 试 想 一 下 ， 
如 果 一 个 控制 核电 厂 的 实时 系统 不 能 对 反应 堆 的 临界 高 温 报 警 信号 做 出 足够 快 的 响应 ， 将 会 发 生 什 么 
情况 ? 在 一 些 硬 (时 间 要 求 非常 苛刻 ) 实时 系统 (hard real-time system) 中 是 不 能 出 任何 差错 的 。 否 
则 ， 如 果 时 限 不 能 满足 ， 可 能 会 有 潜在 的 致命 后 果 。 在 一 些 软 〈 时 间 要 求 不 那么 苛刻 ) 实时 系统 (soft 
reaj-time system) 中 ， 虽 然 对 时 限 的 要 求 也 是 必须 的 ， 但 是 如 果 时 上限 条 件 不 满足 ， 不 至 于 导致 灾难 性 
的 结果 。QNX 是 实时 操作 系统 (real-time operating system，RTOS) 的 一 个 典型 代表 ， 它 能 够 严格 满 
足 时 间 调 度 的 要 求 。QNX 同样 适合 于 岩 入 式 系统 ，QNX 功能 强大 ,另外 带 有 一 个 小 的 轨迹 履 盖 区 
(footprint)( 要 求 占用 少许 内 存 )， 并 且 趋 向 于 非常 的 安全 和 可 靠 。 

多 处 理 器 系统 《multiprocessor system) 有 其 本 身 所 面临 的 挑战 ， 因 为 需要 对 多 个 处 理 器 进行 调度 
安排 。 操 作 系统 如 何 将 各 个 程序 进程 分 配给 不 同 的 处 理 器 是 设计 时 需要 考虑 的 主要 问题 。 通 常 ， 在 一 
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个 多 处 理 器 环境 中 ， 为 了 解决 问题 需要 多 个 CPU 相互 协调 ， 并 行 地 工作 来 达到 一 个 共同 的 目标 。 处 理 
器 活动 的 协调 工作 要 求 各 个 处 理 器 之 间 有 某 种 相互 联络 (通信) 的 方法 。 系 统 同步 性 要 求 决定 了 是 采 
用 紧密 耦合 的 通信 方式 ， 还 是 松散 耦合 的 通信 方式 来 设计 处 理 器 。 

紧密 耦合 的 多 处 理 器 (tightly coupled multiprocessor) 共享 一 个 单一 的 集中 式 存 储 器 ， 这 要 求 操 
作 系 统 必须 非常 小 心地 对 各 个 程序 进程 进行 同步 处 理 以 保护 各 种 资源 的 安全 。 这 种 耦合 方式 通常 用 于 
16 个 或 者 更 少 一 些 的 处 理 器 上 。 对 称 式 多 处 理 器 (symmetric multiprocessor，SMP) 是 紧密 耦合 的 体 
系 结构 中 非常 流行 的 一 种 形式 。 这 些 系统 具有 共享 存储 器 和 IO 设备 的 多 个 处 理 器 。 所 有 处 理 医 热 行 
同样 的 功能 ， 要 处 理 的 任务 将 会 被 分 配 到 所 有 的 处 理 器 。 

松散 耦合 的 多 处 理 器 (loosely coupled multiprocessor) 各 一 个 物理 上 的 分 布 式 存储 器 ,也 就 是 我 
们 所 谓 的 分 布 式 系统 (distributed system)。 对 于 分 布 式 系统 ， 我 们 可 以 用 两 种 不 同 的 方法 来 观察 。 
局 域 网 (LAN) 上 的 分 布 式 工作 站 的 集合 通常 称 为 网 络 系统 (network system)， 系 统 中 的 每 台 工 作 
站 都 有 自己 的 操作 系统 。 设 计 这 类 系统 的 目的 是 为 了 让 多 台 计 算 机 共享 资源 。 要 将 多 台 计 算 机 连接 
到 网 络 上 ， 网 络 操作 系统 应 该 包括 一 些 必要 的 功能 ， 例 如 远程 命令 执行 ， 远 程 文件 访问 ， 以 及 远程 
登陆 等 。 用 户 的 程序 进程 同样 可 以 通过 网 络 和 另 一 台 机 器 上 的 程序 进程 相互 通信 。 网 络 文件 系统 是 
计算 机 网 络 系统 的 最 重要 的 应 用 之 一 。 尽 管 每 台 计 算 机 处 于 不 同 的 地 理 位 置 ， 具 有 不 同 的 体系 结构 
和 不 同 的 操作 系统 ， 但 是 网 络 文件 系统 允许 多 台 计 算 机 共享 一 个 逻辑 文件 系统 。 这 些 系 统 之 间 的 相 
互 周 步 是 一 个 非常 重要 的 问题 ， 但 是 系统 相互 间 的 通信 问题 可 能 更 加 重要 ， 因 为 这 些 通信 可 能 发 生 
在 远 距 离 网 络 之 间 。 虽 然 网 络 系统 中 的 计算 机 可 以 分 布 在 不 同 的 地 理 位 置 ， 但 是 这 种 系统 并 不 是 真 
正 的 分 布 式 系统 。 

真正 的 分 布 式 系统 与 这 些 网 络 系统 的 重要 区 别 在 于 : 分 布 式 操作 系统 在 所 有 计算 机 上 并 发 地 运行 ， 
从 用 户 的 角度 来 看 ， 分 布 式 系统 就 是 一 台 单 一 的 计算 机 系统 。 与 此 相反 ， 在 一 个 网 络 系统 中 ， 计 算 机 
的 用 户 能 够 感知 到 其 他 机 器 的 存在 。 因 此 ， 透 明 性 是 分 布 式 系统 中 的 一 个 重要 议题 。 在 分 布 式 系统 中 ， 
不 会 简单 地 因为 文件 保存 在 不 同 的 位 置 ， 而 要 求 用 户 为 文件 使 用 不 同 的 名 字 。 用 户 只 需 对 不 同 的 机 器 
使 用 不 同 命令 ， 或 者 执行 其 他 任何 只 与 机 器 位 置 有 关 的 交互 〈 对 话 ) 操作 。 

最 重要 的 一 点 是 ， 为 多 处 理 器 设计 的 操作 系统 和 为 单一 处 理 器 设计 的 操作 系统 之 间 并 没有 重大 的 
区 别 。 但 是 ， 这 两 种 操作 系统 之 间 的 主要 差别 是 时 间 调 度 问 题 ， 因 为 多 个 CPU 都 必须 保持 忙碌 状态 。 
如 果 时 间 调 度 安排 不 恰当 ， 多 处 理 器 并 行 执行 的 周 有 优 势 就 不 能 完全 体现 出 来 。 特 别 是 如 果 操 作 系 统 
不 能 提供 合适 的 工具 来 开发 多 处 理 器 的 并 行 执行 功能 ， 多 处 理 器 系统 的 性 能 就 会 大 打折 扣 。 

正如 我 们 所 提 到 的 ， 实 时 系统 要 求 专门 设计 的 操作 系统 。 实 时 系统 和 嵌入 式 系 统 都 要 求 尽量 小 的 
操作 系统 和 使 用 最 少 的 系统 资源 。 另 外 ， 无 线 网 络 结合 了 媒人 式 系 统 的 紧凑 性 和 网 络 系统 的 诸多 特征 ， 
也 已 经 在 推动 着 操作 系统 设计 的 革新 。 





个 人 计算 机 操作 系统 的 应 用 目标 与 大 型 计算 机 操作 系统 是 不 同 的 。 大 型 机 系统 主要 希望 能 够 提供 
出 色 的 性 能 和 硬件 利用 率 ， 同 时 也 考虑 怎样 让 系统 变 得 方便 使 用 。 而 个 人 计算 机 操作 系统 的 主要 目的 
是 为 用 户 提供 更 友好 的 使 用 环境 。 

当 Intel 公司 在 1974 年 推出 8080 微 处 理 器 时 ， 曾 经 邀请 Gary Kildall 帮 公 司 编 写 一 个 操作 系统 。 
Kildall 开发 了 一 个 软盘 控制 器 ， 将 磁盘 和 8080 连接 起 来 ， 并 且 为 8080 的 控制 系统 书 编 了 一 个 操作 系 
统 。Kildall 将 这 种 基于 磁盘 的 操作 系统 称 为 CP/M (微型 计算 机 的 控制 程序 ，Control Program for Mi- 
crocomputers) 。BIOS (基本 输入 输出 系统 ，Basic Input/Output System) 人 允许 CP/M 能 够 很 方便 地 移 
植 到 不 同 种 类 的 PC 机 上 ， 原 因 是 BIOS 为 输入 和 输出 装置 提供 了 所 必需 的 交互 作用 。 因 为 IO 设备 在 
不 同 的 系统 之 间 是 最 可 能 发 生变 化 的 组 件 ， 所 以 通过 将 这 些 设备 的 接口 打包 成 一 个 模块 ， 实 际 操作 系 
统 就 可 以 相对 于 不 同 机 器 保持 不 变 。 而 需要 改变 的 只 有 BIOS。 

Intel 公司 错误 地 认为 基于 磁盘 的 计算 机 系统 没有 什么 发 展 前 途 。 在 决定 不 使 用 这 种 新 的 操作 系统 
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后 ，Intel 公司 将 CP/M 的 专利 权 交 给 了 Kildall。1980 年 ，IBM 公司 需要 为 其 IBM PC 机 装备 一 个 操作 
系统 。 尽 管 IBM 公司 首先 与 Kildall 进行 洽谈 ， 但 是 这 桩 交易 最 终 交 给 了 Microsoft 公司 。Microsoft 公 
司 花 15 000 美元 从 西雅图 的 计算 机 产品 公司 购买 了 一 个 名 为 QDOS (quick and dirty operating system) 
的 基于 磁盘 的 操作 系统 。 这 个 软件 后 来 并 重新 命名 为 MS-DOS， 其 他 的 事情 现在 已 经 成 为 历史 。 

早期 的 个 人 计算 机 操作 系统 是 通 人 键盘 输入 命令 来 操作 的 。 当 两 位 Xerox Palo Alto 研究 中 心 人 
员 ，GUI (图 形 用 户 界面 ，graphical user interface) 的 发 明 者 Alan Key 和 鼠标 的 发 明 者 Doug En- 
gelbart 将 他 们 的 思想 结合 在 一 起 时 ， 就 永久 地 改变 了 操作 系统 的 外 观 。 通 过 他 们 的 努力 ， 原 来 的 命令 
提示 符 已 经 由 窗口 、 图 标 和 下 拉 菜 单 所 代替 。Microsoft 公司 通过 Windows 系列 操作 系统 : Windows 
1. x、2. x、3. x、95、98、ME、NT2000 和 XP， 普 及 了 这 种 图 形 界面 的 思想 ， 当 然 这 些 思想 并 不 是 他 
们 所 发 明 的 。Macintosh 的 图 形 操作 系统 ，MacOS， 比 Windows GUI (图 形 界面 ) 要 提前 几 年 出 现 ， 
也 经 历 了 许多 版 本 。Unix 通过 Linux 和 OpenBSD 在 个 人 计算 机 中 也 变 得 流行 起 来 。 当 然 ， 还 有 许多 
其 他 磁盘 操作 系统 ， 例 如 : DR DOS、PC DOS 和 OS/2 等 。 但是, 它们 都 没有 Windows 操作 系统 这 样 
流行 ， 也 没有 Unix 操作 系统 这 样 多 的 变 体 。 


8. 2.2 操作 系统 设计 


因为 计算 机 本 身 所 使 用 的 最 重要 的 单一 软件 部 分 是 计算 机 操作 系统 ， 所 以 我 们 必须 对 操作 系统 的 
设计 给 予 足够 的 重视 。 操 作 系统 控制 计算 机 的 一 些 基 本 功能 ， 包 括 存储 器 的 管理 和 IVO， 以 及 计算 机 
的 “视觉 和 触觉 〈look and feel)” 的 界面 。 操 作 系统 与 大 部 分 其 他 软件 的 区 别 在 于 操作 系统 是 事件 驱 
动 (event driven) 的 ， 这 也 意味 着 操作 系统 是 通过 响应 输入 命令 、 应 用 程序 、LO 设备 和 中 断 的 事件 
来 执行 相关 的 任务 。 

计算 机 操作 系统 设计 有 4 个 主要 的 驱动 因素 : 性 能 、 功 率 、 成 本 和 兼容 性 。 到 现在 为 止 ， 我 们 应 
该 对 什么 是 操作 系统 有 了 一 种 感性 认识 。 但 是 ， 关 于 操作 系统 应 该 是 什么 样 这 个 问题 却 有 着 许多 不 辣 
的 观点 。 也 因此 出 现 了 各 式 各 样 的 操作 系统 。 大 多 数 操作 系统 郁 有 类 似 的 接口 ， 但 是 在 如 何 执行 任务 
方面 却 有 很 大 的 不 同 。 有 些 操作 系统 选择 的 是 最 小 化 设计 ， 只 能 完成 一 些 最 基本 的 功能 。 然 而 ， 其 他 
一 些 操作 系统 却 试图 包含 所 有 可 以 想像 得 到 的 功能 特征 。 某 些 操作 系统 有 出 色 的 接口 界面 ， 但 在 其 他 
的 方面 却 相对 欠缺 些 。 另 外 一 些 操作 系统 则 可 能 在 内 存 管 理 和 1/0 控制 方面 很 优秀 ， 但 在 用 户 友 好 界 
面 的 方面 却 显得 不 足 。 没 有 一 个 操作 系统 能 够 在 各 个 方面 都 做 得 很 完美 。 

在 操作 系统 设计 中 有 两 个 关键 组 件 ， 内核 和 系统 程序 。 内 核 (kernel) 是 操作 系统 的 核心 。 操 作 系 
统 中 的 进程 管理 程序 、 调 度 程序 、 资 源 管理 程序 和 I/O 控制 程序 等 都 要 使 用 内 核 。 内 核 负责 操 作 系统 
的 事务 调度 、 同 步 、 保 护 / 安 全 、 内 存 管 理 和 中 其 处 理 。 内 核 具 有 对 主要 硬件 设备 的 控制 功能 ， 包 括 中 
断 、 控 制 寄 存 器 、 状 态 字 和 定时 器 等 。 内 核 中 装载 了 所 有 的 设备 驱动 ， 可 以 提供 一 些 常用 的 功能 和 协 
调 所 有 的 1/O 事件 。 内 核 必须 了 解 硬件 的 具体 细节 ， 以 便 将 硬件 的 各 个 部 分 全 部 组 合 起 来 构成 一 个 工 
作 系 统 。 

内 核 设 计 中 的 两 种 极端 情况 是 : 微 核 (microkernel) 体系 结构 和 单 (monolithice) 内 核 体 系 结构 。 
微 内 核 提 供 一 些 最 基本 的 操作 系统 功能 ， 要 依赖 于 其 他 模块 的 支持 来 完成 特定 的 任务 。 这 样 ， 微 内 核 
将 许多 典型 的 操作 系统 的 任务 都 移 到 了 用 户 空间 。 这 样 就 允许 系统 重启 或 重新 配置 许多 服务 程序 ， 而 
不 需要 重新 启动 整个 操作 系统 。 微 内 核 可 以 提供 一 定 程 度 的 安全 保障 ， 因 为 在 用 户 层 运行 的 各 种 服务 
程序 只 能 对 系统 的 资源 进行 有 限制 的 访问 。 与 单 内 核 相 比 ， 微 内 核 更 容易 定制 和 移植 到 其 他 硬件 平台 。 
但 是 ， 在 内 核 和 其 他 模块 之 间 需 要 增加 额外 的 通信 ， 这 样 常常 会 造成 系统 的 速度 减 慢 和 效率 降低 。 微 
内 核 设 计 的 典型 特征 是 规模 较 小 ， 具 有 方便 的 可 移植 性 ， 以 及 大 量 的 服务 程序 运行 在 内 核 层 的 上 层 而 
不 是 运行 在 内 核 本 身 。SMP 和 其 他 多 处 理 系统 的 发 展 ， 大 大 促进 了 微 内 核 的 开发 。 微 内 核 操作 系统 的 
范例 包括 ，Windows 2000、Mach 和 QNX 操作 系统 。 

单 内 核 利 用 一 个 单一 进程 来 提供 操作 系统 的 所 有 基本 功能 。 因 此 ， 单 内 核 比 微 内 核 大 得 多 。 通 常 ， 
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针对 特定 的 硬件 系统 ， 单 内 核 直 接 与 硬件 发 生 交 互 。 所 以 ， 与 微 内 核 的 操作 系统 相 比 ， 单 内 核 操 作 系 
统 更 容易 进行 优化 。 正 是 由 于 这 个 原因 ， 单 内 核 不 容易 移植 。 典 型 的 单 内 核 操 作 系 统 包括 : Linux、 
MacOS 和 DOS 操作 系统 。 

除了 管理 资源 外 ， 操 作 系统 本 身 还 会 消耗 资源 ， 所 以 设计 人 员 还 必须 考虑 产品 的 总 大 小 。 例 如 ， 
Sun 公司 的 Solaris 操作 系统 的 完全 安装 需要 8M 的 磁盘 空间 ，Windows 2000 需要 大 约 两 倍 的 空间 。 这 些 
统计 数字 表明 在 过 去 的 20 年 中 ， 操 作 系统 的 功能 在 不 断 扩 充 。 一 张 100K 的 软盘 足以 安装 MS-DOS1. 0。 


8.2.3 操作 系统 服务 


在 前 面 有 关 操 作 系 统 体 系 结构 的 讨论 中 ， 我 们 提 到 了 操作 系统 可 以 提供 的 一 些 最 重要 的 服务 功能 。 
操作 系统 负责 监视 所 有 关键 性 的 系统 管理 任务 ， 包 括 存储 器 管理 ， 进 程 管理 ， 保 护 ， 以 及 与 /0 设备 
的 交互 操作 。 作 为 一 个 接口 的 角色 ， 操 作 系 统 决 定 了 用 户 怎样 与 计算 机 进行 交互 对 话 ， 在 用 户 和 硬件 
设备 之 间 起 到 缓冲 器 的 作用 。 操 作 系 统 的 这 些 功能 中 的 每 一 项 都 是 决定 整个 系统 的 性 能 和 可 用 性 的 重 
要 因素 。 事 实 上 ， 有 时 人 们 宁愿 牺牲 一 些 系统 功能 ， 而 选择 一 个 使 用 较为 方便 的 计算 机 系统 。 这 种 平 
衡 的 考量 在 图 形 用 户 界面 的 领域 会 更 加 明显 。 

人 机 接口 

操作 系统 在 用 户 和 计算 机 硬件 之 间 提 供 了 一 个 抽象 层次 。 不 论 是 用 户 还 是 应 用 程序 都 不 需要 直接 
面 对 硬 件 ， 这 是 因为 操作 系统 提供 了 一 种 接口 ， 可 以 隐藏 机 器 硬件 的 细节 。 操 作 系统 有 三 个 基本 接口 ， 
每 种 接口 都 是 为 某 类 特殊 用 户 提供 一 种 不 同 的 视角 。 硬 件 开发 人 员 感 兴趣 的 是 操作 系统 能 作为 硬件 的 
一 种 接口 。 应 用 程序 设计 人 员 将 操作 系统 视 为 各 种 应 用 程序 和 服务 程序 的 一 种 接口 。 而 普通 用 户 最 关 
心 的 是 图 形 界面 (接口 )， 这 也 是 接口 这 一 术语 最 通常 所 包含 的 意义 。 

操作 系统 的 用 户 界面 分 为 两 大 类 : 命令 行 界面 (command line interface) 和 图 形 用 户 界 面 (graph- 
ical user interfaces，GUDJ) 。 命 令 行 界面 中 有 一 个 命令 提示 符 。 在 命令 提示 符 下 ， 用 户 可 以 输入 各 种 命 
令 ， 包 括 复制 〈 拷 贝 ) 文件 、 删 除 文件 、 显 示 目 录 列 表 和 更 改 目 录 结 构 的 命令 等 。 命 令 行 界面 要 求 用 
户 了 解 系统 命令 的 语法 ， 这 一 点 通常 对 普通 用 户 来 说 很 困难 。 然 而 ， 对 于 精通 某 种 特殊 命令 词汇 的 人 
来 说 ， 使 用 直接 命令 来 执行 任务 比 使 用 图 形 界 面 的 效率 更 高 。 另 一 方面 ， 图 形 用 户 界面 (GUI) 为 普 
通用 户 提供 了 一 个 更 容易 使 用 的 界面 。 现 代 的 图 形 用 户 界 面 由 放置 在 桌面 上 的 许多 窗口 组 成 。 这 些 窗 
口中 包含 各 种 图 标 和 代表 文件 的 图 示 ， 利 用 鼠标 对 这 些 图 标 进行 操作 。 命 令 行 界面 的 例子 有 Unix 
shells 和 DOS 界面 。 图 形 用 户 界面 包括 Microsoft Windows 和 MacOS 等 不 同 风 格 的 操作 系统 。 设 备 价 
格 ， 特 别 是 处 理 器 和 存储 器 价格 的 不 断 下 降 ， 使 在 许多 其 他 操作 系统 增加 图 形 用 户 界 面 变 得 切实 可 行 。 
特别 令 人 感 兴趣 的 是 ， 许 多 Unix 操作 系统 都 包含 普通 的 X Window 系统 。 

用 户 界面 是 一 个 程序 ， 或 者 是 一 个 小 的 程序 集 ， 这 些 程序 组 成 了 显示 管理 程序 (display manag- 
er) 。 这 个 用 户 接口 模块 通常 和 驻 留 在 操作 系统 内 核 中 的 核心 操作 系统 功能 是 分 离 的 。 现 代 操 作 系 统 会 
创建 一 个 整体 的 操作 系统 程序 包 ， 其 中 包含 接口 模块 ， 文 件 处 理 模块 ， 以 及 其 他 一 些 与 操作 系统 内 核 
紧密 捆绑 在 一 起 的 应 用 程序 模块 。 这 些 模块 之 间 的 相互 链接 方式 是 当今 操作 系统 中 必须 定义 的 一 个 
特性 。 





进程 管理 是 操作 系统 服务 的 核心 部 分 。 进 程 管理 包括 从 创建 进程 〈 即 设置 一 些 合适 的 结构 来 保存 
每 个 进程 信息 ) 开始 ， 到 调度 各 种 资源 在 进程 中 的 使 用 ， 直 到 删除 进程 和 进程 结束 后 的 清理 工作 的 所 
有 事件 。 操 作 系 统 跟 踪 每 个 进程 ， 包 括 进 程 的 状态 〈 其 中 包括 变量 值 、CPU 寄存 器 中 的 内 容 和 进程 的 
实际 状态 ， 例如 运行 、 就 绪 或 等 待 )， 进 程 正在 使 用 的 资源 情况 ， 以 及 一 些 要求 的 其 他 信息 。 操 作 系统 
时 刻 监 视 每 个 进程 的 活动 以 防止 出 现 同步 问题 (synchronization problem)。 当 一 些 并 发 的 进程 需要 访 
问 某 些 共享 资源 时 ， 就 会 产生 同步 问题 。 显 然 ， 操 作 系统 必须 对 这 些 活 动 非常 仔细 进行 监控 ， 以 避免 
数据 的 不 一 致 性 和 受到 某 些 意外 的 干扰 。 
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在 任意 时 刻 ， 操 作 系 统 内 核 都 在 管理 一 组 进程 的 集合 ， 包 括 用 户 进程 和 系统 进程 。 大 多 数 进程 之 
间 都 是 相互 独立 的 。 然 而 ， 当 它们 需要 相互 交流 来 完成 某 个 共同 的 目标 时 ， 就 要 依赖 于 操作 系统 的 帮 
助 来 实现 进程 之 间 的 通信 任务 。 

进程 调度 是 操作 系统 的 主要 日 常 工作 之 一 。 首 先 ， 操 作 系统 必须 决定 哪些 进程 允许 进入 系统 〈 通 
常 称 为 长 程 调度 ，long-term scheduling)。 然 后 ， 操 作 系 统 还 必须 决定 在 任意 给 定时 刻 ， 嘟 个 进程 会 得 
到 CPU 许可 被 执行 〈 称 为 短程 调度 ，short-term scheduling)。 为 了 完成 短程 调度 ， 操 作 系 统 需要 保持 
一 个 已 经 准备 就 绪 的 进程 队列 的 名 单 。 这 样 ， 操 作 系统 就 能 够 区 分 哪些 进程 在 等 待 资源 ， 哪 些 进 程 在 
准备 调度 和 运行 。 如 果 一 个 正在 执行 进程 需要 LI/O 或 者 是 其 他 资源 ， 则 该 进程 会 自动 放弃 CPU， 并 将 
自己 置 于 等 待 的 进程 队列 上 ， 这 样 就 可 以 对 另外 一 个 要 执行 的 进程 进行 调度 ， 此 过 程 就 是 一 个 关联 转 
换 (context switch)。 

在 关联 转换 过 程 中 ， 必 须 保存 所 有 与 现在 正在 运行 的 进程 相关 的 信息 ， 这 样 当 重新 执行 该 进程 
时 ， 系 统 可 以 恢复 到 该 进程 中 断 时 的 确切 状态 。 关 联 转换 中 需要 保存 的 信息 包括 : CPU 寄存 器 中 的 
内 容 、 页 表 和 与 虚拟 存储 器 有 关 的 其 他 信息 。 一 旦 这 些 信息 被 安全 地 保存 起 来 ， 先 前 中 断 的 进程 
〈 即 正在 准备 使 用 CPU 的 进程 ) 就 可 恢复 到 该 进程 先前 中 断 时 的 确切 状态 〈 新 进程 没有 先前 的 状 
态 ) 。 

进程 可 以 采用 两 种 方式 放弃 CPU。 在 非 占 先 调度 (nonpreemptive scheduling) 事务 中 ， 某 个 进程 
会 自动 放弃 CPU， 可 能 是 因为 该 进程 需要 某 些 没有 预先 安排 好 的 其 他 资源 。 但 是 ， 如 果 系 统 的 设置 是 
按 分 段 时 间 使 用 的 ， 则 该 进程 有 可 能 被 操作 系统 从 一 个 正在 运行 的 状态 转移 到 一 个 等 待 的 状态 。 这 种 
过 程 称 为 占 先 调度 〈preemptive scheduling)， 因 为 该 进程 被 别 的 进程 占 先 取代 ， 并 且 CPU 的 使 用 权 被 
剥夺 。 当 各 个 进程 都 按照 优先 级 来 进行 任务 调度 和 产生 中 断 时 ， 也 会 发 生 这 种 占 先 调度 的 问题 。 例 如 ， 
如 果 一 个 低 优先 级 的 任务 正在 执行 的 过 程 中 ， 有 一 个 高 优先 级 的 任务 需要 使 用 CPU， 则 低 优先 级 的 任 
务 马 上 会 被 放置 到 等 待 队 列 中 执行 一 个 关联 转换 )， 人 允许 高 优先 级 的 任务 立即 执行 。 

在 进程 调度 中 操作 系统 的 主要 任务 是 决定 等 待 队 列 中 哪 一 个 将 是 下 一 个 使 用 CPU 的 进程 。 影 响 调 
度 的 决定 因素 包括 : CPU 的 利用 率 、 吞 吐 量 、 周 转 时 间 、 等 待 时 间 和 反应 时 间 。 短 程 调度 可 以 有 很 多 
种 方案 。 这 些 方法 包括 : 先 到 先 服务 (FCFS) 调度 ， 最 短 作业 优先 (SJF) 调度 ， 循 环 调度 和 优先 级 
调度 。 在 先 到 先 服 务 的 调度 (first-come，first-served scheduling) 中 ,操作 系统 是 按照 进程 请 求 的 顺 
序 来 为 各 个 进程 分 配 处 理 器 资源 。 当 正在 执行 的 进程 终止 时 ， 就 会 放弃 对 CPU 的 控制 。FCFS 调度 是 
一 个 非 占 先 的 调度 算法 ， 其 优点 是 这 种 调度 方法 很 容易 实现 。 但 是 ， 这 种 调度 方法 并 不 适合 于 支持 多 
用 户 的 计算 机 系统 ， 因 为 一 个 进程 要 使 用 CPU 必须 等 待 的 平均 时 间 会 有 很 大 差别 。 另 外 ， 某 个 进程 有 
可 能 会 独占 CPU， 造 成 其 他 正在 等 待 的 进程 的 执行 过 程 被 无 限制 地 延期 。 

在 最 短 作 业 优 先 调度 (shortest job first scheduling) 方案 中 ， 具 有 最 短 执 行 时 间 的 进程 优 于 系统 
中 所 有 其 他 进程 取得 CPU 使 用 的 优先 权 。 可 以 证 明 ，SJF 是 一 种 最 佳 的 进程 调度 算法 。 但 是 ，SJF 遇 
到 的 主要 问题 是 ， 还 没有 方法 能 够 预先 准确 地 知道 一 个 将 要 运行 的 任务 到 底 有 多 长 。 使 用 最 短 作 业 优 
先 调度 方案 的 系统 会 应 用 某 些 试探 性 的 方法 来 “ 估 测 (guesstimate)” 任 务 的 运行 时 间 。 但 是 ， 这 些 试 
探 性 的 方法 还 远 远 不 够 完善 。 最 短 作 业 优 先 调度 方法 可 以 是 占 先 调度 ， 也 可 以 是 非 占 先 调度 。 这 里 ， 
占 先 通常 被 解释 为 最 短 剩 余 时 间 优 先 〈shortest remaining time first) 。 

循环 调度 〈round robin scheduling) 是 一 种 公平 和 简单 的 优先 调度 方案 。 操 作 系统 为 每 个 进程 分 配 
一 定 的 CPU 时 间 片 段 。 如 果 分 配给 某 个 进程 的 时 间 片 段 终 止 时 ， 即 使 该 进程 还 在 执行 ， 操 作 系 统 也 会 
通过 关联 转换 将 该 进程 交换 出 去 。 随 后 ， 正 在 等 待 队列 中 的 下 一 个 进程 将 会 被 赋予 一 个 属于 它 自己 的 
CPU 时 间 片 段 。 循 环 调度 已 经 广泛 应 用 于 分 时 共享 的 操作 系统 中 。 如 果 调 度 程 序 采用 的 时 间 片 段 足 够 
小 ， 那 么 用 户 们 就 感觉 不 到 他 们 是 在 共享 系统 的 资源 。 但 是 ， 这 种 循环 调度 的 时 间 片 段 也 不 能 划分 得 
太 小 ， 否 则 相 比 之 下 关联 转换 时 间 会 显得 太 长 了 。 

优先 级 调度 (priority scheduling) 的 方法 与 每 个 进程 的 优先 级 有 关 。 当 短程 调度 程序 要 从 等 待 队 
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列 中 选择 一 个 进程 时 ， 将 会 选中 具有 最 高 优先 级 的 进程 。FCFS 赋予 所 有 的 进程 以 相同 的 优先 级 ，SJF 
将 优先 权 赋 给 最 短 的 作业 任务 。 而 优先 级 调度 所 遇 到 的 最 严重 问题 就 是 存在 潜在 的 资源 缺乏 〈 或 者 说 
饿 死 ，starvation) 问题 ， 或 者 说 存在 着 无 限期 阻塞 的 可 能 性 。 试 想 一 下 ， 如 果 要 在 一 个 繁忙 的 计算 机 
系统 上 运行 一 个 大 的 作业 任务 ， 而 其 他 用 户 又 在 不 停 地 在 你 的 任务 运行 前 提交 一 些 较 短 的 作业 任务 ， 
这 将 会 是 一 件 多 么 令 人 浊 表 的 事情 ? 对 此 还 有 这 样 的 一 个 传说 ， 在 某 个 规模 很 大 的 大 学 里 有 一 台大 型 
计算 机 停止 了 工作 ， 结 果 在 等 待 队 列 中 发 现 一 项 试图 运行 已 经 有 好 几 年 的 任务 。 

某 些 操作 系统 采用 的 是 多 种 调度 方案 的 组 合 方式 。 例 如 ， 一 个 系统 可 能 组 合 使 用 占 先 调度 、 基 于 
优先 级 的 调度 、 先 到 先 服务 的 调度 算法 。 一 些 支持 企业 级 计算 机 系统 的 高 度 复杂 的 操作 系统 允许 用 户 
在 一 定 程度 上 控制 时 间 片 段 的 长 度 ， 控 制 允 许 的 并 发 执行 的 任务 数目 ， 以 及 为 不 同类 型 的 作业 任务 分 
配 不 同 的 优先 级 。 

多 任务 处 理 〈multitasking， 人 允许 多 个 进程 并 发 运行 ) 和 多 线程 技术 (multithreading， 人 允许 一 个 进 
程 向 下 划分 为 多 个 不 同 的 控制 线程 ) 为 CPU 的 进程 调度 带 来 了 新 的 挑战 。 线 程 是 系统 中 的 最 小 可 调度 
单元 。 各 个 线程 共享 与 它们 的 进程 母体 相同 的 执行 环境 ， 包 括 进程 的 CPU 寄存 器 和 页 表 。 正 因为 这 
样 ， 线 程 中 的 关联 转换 所 产生 的 开销 更 小 。 因 此 ， 这 些 线程 中 的 关联 转换 发 生 的 速度 要 比 一 个 涉及 整 
个 进程 的 关联 转换 快 得 多 。 根 据 并 发 执行 的 程度 需求 ， 可 以 有 一 个 单线 程 的 进程 ， 一 个 多 线程 的 进程 ， 
多 个 单线 程 的 进程 ， 或 者 多 个 多 线程 的 进程 。 支 持 多 线程 的 操作 系统 必须 能 够 处 理 上 述 的 各 种 组 合 
形式 。 





除了 进程 管理 之 外 ， 操 作 系统 还 要 管理 系统 资源 。 因 为 这 些 系统 资源 比较 昂贵 ， 所 以 最 好 能 够 实 
现 资源 共享 。 例 如 ， 多 个 进程 可 以 共享 一 个 处 理 器 ， 多 个 程序 可 以 共享 一 个 物理 存储 器 ， 以 及 多 个 用 
户 和 多 个 文件 可 以 共享 一 个 磁盘 。 操 作 系 统 主要 关心 的 资源 有 三 种 : CU、 存储 器 和 IO。 操 作 系 统 
利用 调度 程序 来 控制 对 CPU 的 访问 。 而 对 存储 器 和 1/O 的 访问 则 需要 使 用 不 同 组 的 控制 和 功能 子 
程序 。 

第 6 章 讲 过 现代 操作 系统 具有 某 种 类 型 的 用 于 扩充 RAM 的 虚拟 存储 器 。 这 意味 着 几 个 程序 
的 部 分 内 容 可 能 会 在 存储 器 中 共存 ， 而 且 每 个 进程 都 必须 有 一 个 页 表 。 最 初 ， 在 操作 系统 的 设计 
可 以 处 理 虚拟 存储 器 之 前 ， 程 序 员 使 用 一 种 履 盖 (overlay) 技术 来 实现 虚拟 存储 器 。 如 果 一 个 程 
序 太 大 无 法 放 人 到 内 存 中 ， 则 程序 员 会 把 它 分 割 成 一 些 较 小 的 片段 。 在 特定 的 时 刻 ， 只 装载 那些 
运行 程序 所 必需 的 数据 和 指令 。 如 果 程 序 需 要 新 的 数据 或 指令 ， 程 序 员 负 责 (并 借助 编译 器 的 部 
分 帮助 ) 来 确保 正确 的 程序 片段 已 经 被 装载 到 存储 器 中 。 当 时 是 由 程序 员 负 责 管理 存储 器 。 现 
在 ， 操 作 系 统 已 经 接管 了 这 一 类 琐事 。 现 在 的 计算 机 系统 由 操作 系统 负责 将 虚拟 地 址 翻译 成 物理 
地 址 ， 把 页 面 传 给 磁盘 和 从 磁盘 上 取 回 页 面 ， 并 且 负 责 对 存储 器 的 页 表 进 行 维护 。 而 且 ， 操作 系 
统 还 要 确定 主 存储 器 的 分 配 和 跟踪 记录 自由 的 页 巾 。 在 完成 存储 器 空间 的 重新 分 配 后 ,操作 系统 
执行 “垃圾 回收 (garbage collection)” 的 操作 ， 把 一 些小 的 空闲 的 存储 器 碎片 组 合成 一 些 比 较 大 
的 可 用 的 存储 空间 块 。 

除了 共享 单个 有 限 的 存储 器 外 ， 进 程 还 要 共享 IO 设备 ， 在 一 个 应 用 程序 的 请 求 下 完成 大 部 分 
的 输入 和 输出 操作 。 操 作 系 统 为 输入 和 输出 操作 提供 了 必要 的 服务 。 当 然 ， 应 用 程序 在 没有 操作 系 
统 的 帮助 下 也 可 以 处 理 它们 自己 的 IO 操作 。 但 是 ， 这 种 方法 除了 要 需要 付出 双 倍 的 代价 外 ， 还 会 
带 来 数据 保护 和 设备 访问 方面 的 诸多 问题 。 如 果 有 有 几 个 不 同 的 进程 想 同时 使 用 同一 个 WO 设备 ， 那 
么 就 需要 对 这 些 请 求 进行 仲裁 。 当 然 ， 这 种 仲裁 任务 由 操作 系统 负责 完成 。 操 作 系 统 通 过 各 种 不 同 
的 系统 调用 为 /O 提供 某 种 类 属 接口 。 这 种 系统 调用 允许 应 用 程序 通过 操作 系统 来 请 求 一 个 VO 服 
务 。 操 作 系 统 随 后 调用 设备 的 驱动 程序 。 这 些 设备 驱动 程序 中 包括 实现 和 特定 的 VO 设备 相关 的 标 
准 功能 的 软件 。 

操作 系统 还 要 管理 磁盘 文件 ， 负 责 文件 创建 、 文 件 删 除 、 目 录 创 建 和 目录 删除 。 并 且 ， 还 为 处 理 
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文件 和 目录 以 及 它们 映射 到 辅助 存储 器 设备 的 操作 提供 最 基本 的 支持 。 虽 然 /O 设备 的 驱动 程序 负责 
处 理 许多 特殊 的 细节 问题 ， 但 是 还 需要 操作 系统 来 协调 那些 支持 实现 7O 系统 各 种 功能 的 设备 驱动 程 
序 的 活动 。 
安全 和 保护 | 

作为 一 个 资源 和 进程 管理 者 ， 操 作 系统 还 必须 保证 各 种 事件 能 够 正确 、 公 平和 高 效 地 工作 。 然 而 ， 
资源 共享 会 引发 多 次 暴露 的 问题 。 例 如 ， 会 出 现 非 授权 的 访问 和 数据 修改 的 可 能 性 。 因 此 ， 操 作 系统 
还 应 该 担当 资源 的 保护 者 ， 以 确保 某 些 “ 坏 家 伙 ” 和 “臭虫 软件 ”不 至 于 毁坏 一 些 其 他 人 都 需要 的 东 
西 。 并 发 的 进程 之 间 必 须 实施 保护 ， 而 且 还 要 在 所 有 操作 系统 进程 与 所 有 用 户 进 程 之 间 实 施 保护 。 如 
果 没 有 这 类 保护 措施 ， 某 个 用 户 程 序 有 可 能 会 擦 除 掉 操 作 系 统 的 某 些 代码 ， 比 方 说 处 理 中 断 的 代码 。 
对 于 多 用 户 的 计算 机 系统 ， 我 们 需要 增加 额外 的 安全 服务 措施 来 保护 共享 资源 〈 如 存储 器 和 1/O 设备 ) 
和 非 共享 资源 〈 如 个 人 文件 ) 。 存 储 器 保护 可 以 防止 由 于 某 个 用 户 程序 中 的 一 个 错误 而 影响 到 其 他 程 
序 ， 或 者 是 避免 某 个 恶意 程序 控制 整个 系统 。CPU 保护 可 以 确保 用 户 程序 不 会 陷于 无 限 循环 中 而 消耗 
掉 其 他 作业 任务 所 需要 的 CPU 周期 。 | 

操作 系统 可 以 采用 不 同 的 方式 来 提供 安全 服务 。 首 先 ， 可 以 限制 活动 的 进程 只 能 在 它们 自己 的 存 
储 器 空间 中 执行 。 来 自 各 个 进程 的 所 有 1/O 请 求 和 其 他 资源 的 服务 请 求 都 要 通过 操作 系统 传送 ， 然 后 
由 操作 系统 处 理 这 个 请 求 。 操 作 系统 将 在 用 户 模式 下 执行 大 多 数 命 令 ， 而 其 他 命令 则 在 内 核 模式 下 执 
行 。 这 样 ， 系 统 的 资源 就 受到 保护 ， 非 授权 用 户 不 能 访问 。 同 时 ， 操 作 系统 还 提供 了 某 些 方法 来 控制 
用 户 的 访问 ， 通 常 是 通过 登陆 名 和 密码 访问 的 方式 。 如 果 限 制 进程 在 一 个 单一 的 子 系统 或 者 分 区 中 运 
行 ， 则 可 以 提供 更 强 的 保护 。 


8.3 保护 环境 


为 了 提供 保护 ， 多 用 户 操作 系统 要 防止 出 现 进程 在 系统 中 无 节制 运行 的 情况 。 进 程 的 执行 必须 
与 操作 系统 和 其 他 进程 隔离 开 来 。 必 须 对 共享 资源 的 访问 进行 控制 和 协调 ， 以 避免 产生 冲突 。 在 系 
统 中 建立 保护 屏障 的 方法 有 很 多 种 。 在 这 一 部 分 ， 我 们 将 讨论 其 中 的 三 种 :虚拟 机 、 子 系统 和 分 区 。 


8.3.1 虚拟 机 


在 20 世纪 50 年 代 和 60 年 代 的 分 时 系统 中 ， 不 断 遇 到 一 些 与 共享 资源 有 关 的 问题 : 例如 存储 器 、 
磁盘 存储 器 、 读 卡 器 、 打 印 机 和 处 理 器 的 时 钟 周期 等 。 这 个 时 期 的 硬件 系统 还 不 能 支持 许多 计算 机 科 
学 家 头脑 中 的 解决 方案 。 一 个 比较 好 的 解决 方案 是 ， 每 个 用 户 进程 都 有 其 自己 的 处 理 器 ， 即 一 种 虚拟 
机 。 这 种 虚拟 机 可 以 在 一 个 真实 的 计算 机 系统 内 部 与 许多 其 他 虚拟 机 和 平 共处 。 到 了 20 世纪 60 年 代 
末 和 70 年 代 初 ， 硬 件 的 发 展 最 终 变 得 足够 先进 ， 可 以 把 这 种 “虚拟 机 ”思想 应 用 在 通用 的 分 时 计算 机 
系统 中 。 

从 概念 上 来 说 ， 虚 拟 机 非常 简单 。 真 实 的 计算 机 系统 中 的 实际 硬件 都 受到 一 个 控制 程序 〈con- 
trolling program， 或 内 核 ) 的 专用 命令 的 控制 。 控 制程 序 可 以 创建 一 个 任意 数目 的 虚拟 机 。 这 些 虚拟 
机 在 这 种 内 核 环境 下 执行 ， 就 好 像 它们 是 一 些 普 通 的 用 户 进程 ， 受 到 类 似 于 运行 在 用 户 空间 的 程序 
所 受到 的 相同 限制 。 这 个 控制 程序 所 展示 出 来 的 每 个 虚拟 器 的 图 像 非常 类 似 于 实际 计算 机 的 硬件 。 
每 个 虚拟 机 所 看 到 的 都 是 一 个 由 CPU、 寄 存 器 、I/O 〇 设备 和 虚拟 ) 存储 器 组 成 的 环境 ， 而 且 这 些 
资源 就 像 是 这 个 虚拟 机 所 专用 的 。 因 此 ， 虚 拟 机 是 一 种 反映 完整 系统 资源 的 假想 的 机 器 。 如 图 8-1 
所 示 ， 在 虚拟 机 范围 内 执行 的 一 个 用 户 程 序 可 以 访问 为 虚拟 机 定义 的 任何 系统 资源 。 例 如 ， 当 某 个 
运行 在 虚拟 机 中 的 程序 要 调用 一 个 系统 服务 来 将 数据 写 人 磁盘 时 ， 这 个 程序 会 执行 一 个 就 像 在 实际 
机 器 上 运行 时 的 相同 的 系统 调用 。 虚 拟 机 会 接收 I/O 请 求 ， 并 将 请 求 传送 给 控制 程序 ， 以 便 在 实际 
硬件 上 执行 。 

我 们 可 以 在 一 个 虚拟 机 上 运行 一 个 不 同 于 内 核 操 作 系 统 的 操作 系统 ， 也 可 以 在 每 个 虚拟 机 上 运行 
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图 8-1 在 一 个 控制 程序 下 运行 的 虚拟 机 的 图 像 
一 个 彼此 都 不 相同 的 操作 系统 。 事 实 上 ， 通 常 的 情况 就 是 如 此 。 

如 果 在 Microsoft Windows (从 Windows 95 到 Windows XP) 上 打开 一 个 “MS-DOS” 命令 符 窗 
口 ， 这 就 已 经 实例 化 了 一 个 虚拟 机 的 环境 。 这 些 Windows 版 本 上 的 控制 程序 被 称 为 Windows 虚拟 机 
管理 程序 (VMM) 。VMM 是 一 个 32 位 保护 模式 的 子 系统 〈 参 见 下 一 节 )。VMM 负责 创建 、 运 行 、 
监控 和 终止 一 个 虚拟 机 。VMM 在 开机 时 就 被 装载 到 内 存 中 。 当 通过 命令 接口 调用 时 ，VMM 将 创建 
一 个 运行 在 虚拟 16 位 Intel 8086/8088 处 理 器 的 图 像 下 的 “MS-DOS” 机 器 。 尽 管 实际 的 系统 有 更 多 的 
寄存 器 (32 位 ), 但 是 在 DOS 环境 中 执行 的 任务 却 只 能 够 看 到 有 限 个 数 的 具有 8086/8088 处 理 器 特征 
的 16 位 寄存 器 。VMM 控制 程序 首先 将 16 位 指令 转换 (或 者 用 虚拟 机 的 术语 来 说 ， 进 行 形式 转换 ) 
为 32 位 指令 ,然后 再 在 实际 的 系统 处 理 器 中 执行 。 

为 了 服务 硬件 中 断 的 需要 ， 只 要 Windows 启动 时 ，VMM 就 会 自动 装 入 一 组 预先 定义 的 虚拟 设备 
驱动 程序 集 (virtual device drivers，VxD) 。VxD 能 够 仿真 外 部 的 硬件 设备 或 者 仿真 一 个 通过 特权 指令 
访问 的 编程 接口 。VMM 和 32 位 保护 模式 下 的 动态 链接 库 (将 在 第 8. 4. 3 节 中 解释 ) 一 起 协同 工作 ， 
允许 虚拟 设备 截取 中 断 和 错误 。 这 样 ，VMM 就 可 以 控制 一 个 应 用 程序 对 硬件 设备 和 系统 软件 的 访问 。 

当然 ， 虚 拟 设 备 使 用 虚拟 存储 器 。 虚 拟 存储 器 必须 和 操作 系统 的 存储 器 以 及 在 系统 中 运行 的 其 他 
虚拟 机 的 存储 器 相 共 存 。Windows 95 的 存储 器 的 地 址 分 配 图 如 图 8-2 所 示 。 赋 予 每 个 进程 介 于 1MB 
和 1GB 之 间 的 专用 地 址 空间 。 专 用 地 址 空间 不 能 被 其 他 进程 访问 。 如 果 有 某 个 非 授权 的 进程 试图 使 用 
被 保护 的 男 一 个 进程 或 者 是 操作 系统 的 存储 器 (内 存 )， 将 会 发 生 一 个 保护 错误 (protection fault)， 计 
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算 机 会 通过 蓝屏 信息 发 出 警告 。 当 然 ， 系 统 还 提供 共享 存储 器 区 
间 ， 人 允许 这 里 的 数据 和 程序 代码 可 以 在 多 个 进程 中 共享 。 除 了 DDL 
的 部 分 对 所 有 的 进程 开放 外 ， 图 中 上 面 的 部 分 将 保持 系统 虚拟 机 的 
组 件 。 图 中 下 面 的 部 分 是 不 可 寻 址 的 ， 这 部 分 用 作 检 测 指针 错误 的 
一 种 方法 。 

现代 操作 系统 支持 虚拟 机 时 ， 这 些 系统 可 以 提供 更 好 的 保护 、 安 
全 性 和 大 型 企业 级 计算 机 所 要 求 的 易 管 理性 。 虚 拟 机 同样 具有 多 种 硬 
件 平台 的 兼容 性 。 第 8. 5 节 中 所 描述 的 Java 虚拟 机 就 是 这 类 机 器 。 


8.3.2 子 系统 和 分 区 


Windows VMM 是 一 个 子 系统 (subsystem)， 它 在 Windows 引 
导 时 就 启动 。Windows 同样 也 启动 其 他 一 些 专用 功能 的 子 系统 ， 例 
如 文件 管理 、1/O 操作 和 配置 管理 等 。 子 系统 会 创建 一 些 在 逻辑 上 
可 以 进行 单独 配置 和 管理 的 不 同 环境 。 子 系统 运行 在 操作 系统 内 核 
的 上 面 ， 操 作 系统 内 核 为 子 系统 访问 基本 系统 资源 提供 必要 的 支 
持 ， 例 如 访问 多 个 子 系统 必须 共享 的 CPU 调度 程序 。 

每 个 子 系统 都 必须 在 控制 系统 的 语 境 环境 下 进行 定义 。 子 系统 的 
定义 包括 资源 描述 《如 磁盘 文件 )， 输 入 和 输出 队列 ， 以 及 其 他 各 图 8 2 Windows 95 内 存 图 
种 硬件 组 件 ( 如 会 话 终端 和 打印 机 等 )。 子 系统 下 面 的 内 核 通 常 不 能 直接 看 到 为 子 系统 定义 的 各 种 资源 ， 
而 是 要 通过 子 系统 本 身 才能 看 到 这 些 资源 。 图 8-3 为 一 个 子 系统 和 其 他 系统 资源 之 间 相互 关系 的 原理 图 。 
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图 8-3 可 以 为 多 个 子 系统 定义 的 单个 资源 


子 系统 可 以 帮助 管理 高 度 复杂 的 大 型 计算 机 系统 的 各 种 活动 。 因 为 每 个 子 系统 都 是 系统 本 身 的 一 
不 分 立 的 可 控制 实体 ， 所 以 系统 管理 员 能 够 单独 启动 和 停止 各 个 子 系统 ， 而 不 会 干扰 操作 系统 的 内 核 
或 者 是 其 他 任何 正在 运行 的 子 系统 。 每 个 子 系统 都 能 够 通过 重新 分 配 系统 资源 来 单独 进行 调节 ， 例 如 
增加 或 删除 磁盘 空间 或 存储 器 空间 。 而 且 ， 如 果 一 个 进程 脱离 了 某 个 子 系统 的 控制 ， 或 者 是 毁坏 子 系 
统 未 身 ， 通常 只 有 该 进程 所 运行 的 子 系统 会 受到 影响 。 因 此 ， 子 系统 不 仅 使 得 各 个 系统 更 加 容易 管理 ， 
而 且 也 使 得 这 些 系 统 更 加 牢固 可 靠 。 

在 一 些 非常 大 的 计算 机 系统 中 ,， 子 系统 在 对 机 器 和 系统 资源 的 分 割 上 不 能 满足 要 求 。 有 时 ， 为 了 
方便 资源 管理 和 提供 安全 保障 ， 系 统 需要 构筑 一 个 更 加 完善 和 复杂 的 屏障 。 在 这 类 例子 中 ， 系 统 可 能 
会 被 分 解 为 多 个 逻辑 分 区 《logical partition) ， 有 时 称 为 LPAR， 如 图 8-4 所 示 。LPAR 是 在 一 个 物理 
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系统 中 创建 多 个 可 区 分 的 机 器 ,而 且 这 些 机 器 彼此 之 间 并 没有 隐 含 任何 可 以 共享 东西 。 一 个 分 区 的 资 
源 不 能 访问 另外 一 个 分 区 ， 就 像 这 些 分 区 都 是 独立 运行 在 不 同 的 物理 系统 上 。 例 如 ， 如 果 一 个 系统 有 
两 个 分 区 A 和 B， 那 么 只 有 当 这 两 个 分 区 双方 都 同意 在 它们 之 间 建 立 某 种 相互 共享 的 资源 时 ， 如 某 种 
管道 或 信息 队列 ，A 区 才能 从 B 分 区 中 读 取 一 个 文件 。 一 般 来 说 ， 在 逻辑 分 区 之 间 的 文件 复制 只 能 够 
通过 使 用 某 种 文件 传输 协议 或 者 是 由 系统 供应 商 专 为 此 目的 而 编写 的 应 用 程序 来 实现 。 


i 
| 第 n 个 分 区 
| 


= 





图 8-4 逻辑 分 区 和 它们 的 控制 系统 : 资源 不 能 轻松 地 在 分 区 间 共 享 


逻辑 分 区 在 为 用 户 调试 或 者 测试 新 程序 创建 的 “沙盘 ”环境 时 特别 有 用 。 沙 盘 环 境 的 名 字 来 源 于 
这 样 的 想法 : 只 要 游戏 是 在 沙盘 范围 内 进行 ,使 用 这 种 沙盘 的 人 就 可 以 随意 地 按 自己 内 心 的 想法 来 
“ 玩 机 (play around)”。 沙盘 环境 对 访问 系统 资源 设置 有 严格 的 限制 。 在 某 个 分 区 中 运行 的 各 个 进程 决 
不 可 以 有 意 或 无 意 地 访问 驻 留 在 其 他 分 区 内 的 数据 或 进程 。 分 区 通过 对 系统 中 的 各 种 资源 实施 隔离 ， 
避免 这 些 资 源 被 那些 未 授权 的 进程 访问 ， 这 样 就 增加 了 系统 的 安全 性 。 

虽然 子 系统 和 分 区 在 如 何 定义 它们 的 组 成 资源 方面 彼此 不 同 ， 但 是 我 们 可 以 将 它们 想像 为 一 个 计 
算 机 系统 的 分 层 体系 结构 中 的 子 模型 结构 。 在 分 区 环境 中 ， 这 些 子 模型 结构 的 层次 看 起 来 就 像 是 一 个 
相 邻 的 多 层 生日 蛋糕 ， 从 机 器 硬件 层 一 直 扩展 到 应 用 层 。 另 一 方面 ， 子 系统 相互 之 间 的 区 别 并 不 十 分 
明显 ， 这 些 子 系统 的 主要 差别 大 部 分 发 生 在 系统 软件 的 层面 。 


8.3.3 保护 环境 和 计算 机 系统 体系 结构 的 发 展 进程 


直到 最 近 ， 虚 拟 机 、 子 系统 和 逻辑 分 区 都 被 认为 是 “ 老 技 术 ” 的 大 型 计算 机 系统 的 产物 。 整 个 20 
世纪 90 年 代 ， 人 们 普遍 相信 小 型 计算 机 系统 要 比 大 型 计算 机 系统 具有 更 好 的 性 价 比 。 “客户 机 -服务 器 
(client-server)” 的 范式 被 认为 是 具有 更 好 的 用 户 友好 界面 和 能 够 更 好 地 响应 动态 商业 环境 。 对 小 型 计 
算 机 的 应 用 程序 的 开发 工作 很 快 吸引 了 一 批 天 才 的 编程 人 员 。 不 久 ， 人 们 发 现 像 文字 处 理 和 日 程 管理 
这 类 的 办 公 自 动 化 程序 ， 可 以 更 平滑 地 运行 在 由 多 个 小 型 文件 服务 器 所 支持 的 协作 网 络 的 工作 环境 中 。 
利用 打印 服务 器 来 控制 支持 网 络 的 激光 打印 机 ， 可 以 在 普通 打印 纸 上 产 生 清 晰 干净 的 输出 结果 。 而 且 ， 
这 些 激光 打印 机 的 速度 要 比 大 型 计算 机 系统 申 使 用 的 、 以 特殊 形式 输出 的 和 效果 很 差 的 线性 打印 机 要 
快 得 多 。 事 实证 明 ， 桌 面 型 计算 机 和 小 型 服务 器 系统 可 以 为 用 户 提供 与 大 型 计算 机 系统 所 能 提供 的 相 
同 的 原始 计算 能 力 和 方便 性 ， 而 成 本 却 只 有 大 型 计算 机 系统 的 一 小 部 分 。 当 然 ， 原 始 计算 能 力 只 是 一 
个 企业 计算 系统 的 一 部 分 功能 。 

当 办 公 自 动 化 系统 移 到 办 公 桌 面 时 ， 人 们 构建 了 办 公 室 网 络 以 便 把 桌面 型 计算 机 系统 相互 连接 起 
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来 ， 并 且 与 用 做 文件 档案 和 其 他 重要 商业 记录 的 存储 库 的 文件 服务 器 连接 在 一 起 。 后 来 ， 人 们 使 用 了 
应 用 程序 服务 器 来 负责 运行 那些 执行 核心 商业 管理 功能 的 程序 。 当 各 大 公司 开始 支持 因特网 连接 时 ， 
人 们 就 在 网 络 上 增加 了 电子 邮件 功能 和 Web 服务 器 。 如 果 在 网 络 上 有 任何 服务 器 发 生 处 理 故障 ， 当 时 
最 简单 的 解决 方案 是 增加 另 一 台 服 务 器 来 分 担 这 台 服 务 器 的 负载 任务 。 到 20 世纪 90 年 代 末 期 ， 大 型 
企业 都 拥有 巨大 的 服务 器 站 (server farm)， 可 以 支持 成 百 上 千 台 独立 的 服务 器 处 于 环境 上 受 控 的 和 安 
全 可 靠 的 机 制 下 工作 。 很 快 服务 器 站 就 开始 变 得 需要 耗费 相当 可 观 的 人 力 资源 ， 因 为 每 台 服务 器 都 需 
要 不 定期 的 大 量 维护 工作 。 每 台 服务 器 中 的 内 容 都 必须 备份 到 磁带 上 。 为 了 安全 起 见 ， 这 些 磁带 随后 
被 转移 下 来 作为 离线 保存 。 由 于 每 台 服务 器 都 有 失效 的 潜在 可 能 性 ， 所 以 故障 诊断 和 添加 补丁 程序 成 
为 服务 器 维护 人 员 的 日 常任 务 。 不 久 ， 事 实证 明 小 型 的 、 便 宜 的 计算 机 系统 不 是 人 们 开始 时 所 希望 获 
得 的 那 种 产品 。 这 一 点 对 于 需要 支持 上 百 个 小 型 服务 器 系统 的 企业 来 说 是 千 真 万 确 的 。 

每 个 主要 的 企业 计算 机 制造 厂商 现在 都 提供 一 种 服务 器 整合 (server consolidation) 的 产品 。 不 同 
制造 商 对 于 这 个 问题 有 不 同 的 解决 方案 。 这 些 方案 中 最 令 人 感 兴趣 的 一 种 思想 是 ， 在 一 个 单一 的 大 型 
计算 机 上 创建 一 些 包含 许多 虚拟 机 的 逻辑 分 区 。 服 务 器 整合 有 如 下 优点 : 

。 管 理 一 个 大 系统 要 比 管理 大 量 的 小 系统 更 加 方便 一 些 。 

。 单 个 大 系统 消耗 的 电力 要 比 一 大 群 具 有 同样 计算 能 力 的 小 系统 的 耗 电 少 。 

。 用 电 越 少 ， 产 生 的 热量 就 越 少 ， 这 样 就 会 节约 空调 的 使 用 。 

。 大 型 计算 机 系统 能 够 提供 更 好 的 容错 保护 ， 因 为 大 系统 中 通常 包含 热 备 份 磁盘 和 多 个 处 理 器 。 

。 单 个 的 系统 更 容易 进行 备份 和 恢复 。 

。 单 个 系统 的 占 地 空间 较 小 ， 可 以 减少 房屋 使 用 的 成 本 。 

。 单 个 大 系统 的 软件 使 用 版 权 费 用 要 比 大 量 的 小 系统 的 费用 低 。 

。 对 于 单个 系统 来 说 ， 在 对 系统 软件 和 用 户 程 序 软 件 进行 升级 时 所 需要 的 人 力 要 比 多 系统 少 。 

大 型 计算 机 系统 的 供应 商 ， 如 BM、Unisys 和 Hewlett-Packard 等 ， 很 快 抓 住 了 这 种 服务 器 整合 
的 机 会 : IBM 公司 将 他 们 的 大 型 机 和 中 型 机 的 生产 线 改 造成 为 系列 (eSeries) 的 服务 器 的 生产 线 。 
System/390 系列 大 型 计算 机 改 成 了 Z 系列 (zSeries) 的 服务 器 。Z 系列 的 服务 器 支持 32 个 逻辑 分 区 。 
而 每 个 运行 IBM 虚拟 机 〈VM) 操作 系统 的 逻辑 分 区 可 以 定义 上 千 个 虚拟 的 Linux 系统 。 图 8-5 为 一 
个 eSeries /Linux 模型 的 配置 示意 图 。 就 像 一 个 独立 的 Linux 系统 一 样 ， 每 个 虚拟 的 Linux 系统 都 同样 
能 够 支撑 企业 级 的 应 用 程序 和 电子 商务 活动 ， 但 却 不 需要 任何 管理 费用 。 因 此 ， 原 来 一 个 足球 场 大 小 
的 服务 器 站 现在 可 以 由 一 个 Z 系列“ 机 箱 ” 所 替代 ， 这 个 “机 箱 ” 的 尺寸 通常 比 家 用 电 冰 箱 稍微 大 一 
些 。 可 以 说 ， 服 务 器 整合 技术 的 进步 过 程 是 概括 操作 系统 演变 发 展 的 一 个 缩影 。 计 算 机 系统 制造 商 通 
过 应 用 不 断 进步 的 计算 机 资源 ， 一 直 在 努力 使 他 们 制造 出 来 的 系统 变 得 更 加 容易 管理 ， 同 时 系统 的 功 
能 也 变 得 越 来 越 强大 。 





8-5 ”IBMZ 系列 服务 器 的 逻辑 分 区 中 的 Linux 机 器 的 配置 图 
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8.4 编程 工具 


操作 系统 及 其 应 用 程序 的 集合 为 编程 用 户 和 运行 程序 的 系统 提供 了 一 个 相互 联系 的 接口 。 其 他 一 
些 实用 程序 ， 或 者 称 为 编程 工具 ， 对 于 实现 更 加 机 械 的 软件 开发 是 十 分 必要 的 。 我 们 将 在 下 面 的 章节 
中 讨论 有 关 编 程 工具 的 内 容 。 


8.4. 1 汇编 程序 和 汇编 


在 我 们 讨论 的 计算 机 系统 的 分 层 体系 结构 中 ， 直 接 在 操作 系统 层 上 面 的 一 个 层 是 汇编 语言 层 。 在 
第 4 章 中 ， 我们 提出 了 一 个 非常 简单 的 ， 称 为 MARIE 的 假想 的 计算 机 体系 结构 。 这 个 结构 过 于 简单 ， 
实际 上 并 没有 使 用 这 种 结构 的 机 器 。 首 先 ， 这 个 假想 的 体系 结构 需要 不 断 地 从 存储 器 中 提取 操作 数 ， 
将 使 得 这 个 系统 变 得 非常 慢 。 实 际 的 计算 机 系统 都 通过 采用 足够 数量 的 可 寻 址 的 片 内 寄存 器 ， 来 将 存 
储 器 的 提取 次 数 减 至 最 小 。 另 外 ， 任 何 实际 计算 机 中 的 指令 系统 结构 都 要 比 MARIE 机 器 丰富 得 多 。 
许多 微 处理 器 的 指令 集中 有 超过 1000 条 不 同 的 指令 。 

尽管 我 们 介绍 的 机 器 与 实际 的 计算 机 有 着 非常 大 的 区 别 ， 但 是 这 里 所 讨论 的 汇编 过 程 却 是 相同 的 。 
实际 上 ， 现 在 人 们 使 用 的 每 一 种 汇编 程序 ， 都 要 通读 源 代码 两 次 。 第 一 次 通读 构建 一 个 符号 表 ， 并 且 
汇编 得 到 尽 可 能 更 多 的 代码 ; 第 二 次 通读 是 使 用 从 第 一 次 通读 时 构建 的 符号 表 中 取得 的 地 址 值 ， 来 完 
成 二 进 制 指令 的 转换 。 

大 多 数 汇编 程序 的 最 终 输 出 结果 是 一 段 可 重新 定位 (或 者 说 具有 浮动 地 址 ，relocatable) 的 二 进 制 
指令 流 。 操 作 系 统 可 以 将 程序 代码 装载 到 它 想 要 存放 的 存储 器 的 任何 地 方 。 如 果 操作 数 的 地 址 与 程序 
装 人 内 存 中 位 置 有 关 ， 则 二 进 制 代码 可 以 进行 重 定 位 。 例 如 ， 从 表 4-5 中 取 如 下 的 MARIE 代码 : 

Load x 
Add y 
Store z 
Halt 

x, DEC 35 


y, DEC -23 
z, HEX 0000 


汇编 后 的 代码 输出 看 起 来 可 能 类 似 如 下 : 


1+004 
3+005 
2+006 
7000 
0023 
FEE9 
0000 


例 中 的 “十 ”不 能 取 字面 的 意义 。 它 发 信号 通知 程序 装载 器 (操作 系统 的 一 个 组 件 )。 表 示 第 一 条 
指令 中 的 004 是 相对 于 该 程序 的 起 始 地 址 。 下 面 ， 我 们 讨论 一 下 如 果 程 序 装载 器 正好 将 该 程序 存放 到 
250h 开始 的 内 存 中 ， 会 发 生 什么 情况 。 表 8-1 给 出 了 这 种 情况 下 的 程序 代码 在 内 存 中 的 图 像 。 

如 果 碰 巧 认 为 把 程序 装载 到 从 地 址 400h 开始 的 内 存 中 会 更 好 ,那么 内 存 图 像 看 起 来 类 似 表 8-2 
所 示 。 

与 可 重新 定位 的 代码 相 比 ， 绝 对 代码 (absolute code) 是 一 种 必须 存放 在 内 存 中 的 某 个 特定 位 置 
的 可 执行 二 进 制 代码 。 不 可 重新 定位 的 代码 是 某 些 计算 机 系统 中 具有 一 些 特殊 用 途 的 代码 。 通 常 ， 这 
些 特 殊 应 用 包括 附属 设备 的 显 式 控制 或 系统 软件 的 操作 处 理 ， 其 中 我 们 总 是 可 以 在 某 些 明 确 界 定 的 存 
储 单元 中 找到 一 些 特殊 的 调度 程序 。 

当然 ， 二 进 制 机 器 的 代码 不 能 通过 符号 “十 ”来 区 分 可 重新 定位 的 代码 和 不 可 重新 定位 的 代码 。 
区 分 这 两 种 代码 的 特定 方式 取决 于 执行 这 些 代码 的 操作 系统 的 设计 。 一 种 最 简单 的 区 分 方法 是 对 它们 
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表 8-1 从 地 址 250h 开始 装 入 表 8-2 ”从 地 址 400h 开始 装 入 
程序 时 的 内 存 图 像 程序 时 的 内 存 图 像 





使 用 不 同 的 文件 类 型 (扩展 名 ) 。 MS-DOS 操作 系统 使 用 . COM (命令 文件 ) 扩展 名 来 表示 不 可 重新 
定位 的 代码 ， 而 使 用 . EXE (可 执行 文件 ) 来 代表 可 重新 定位 的 代码 。COM 文件 总 是 从 地 址 100h 开 
始 装 入 。 EXE 文件 则 可 以 被 存放 到 存储 器 的 任意 地 方 ， 甚至 还 可 以 不 占用 连续 的 内 存 空间 。 可 重新 
定位 的 代码 和 不 可 重新 定位 的 代码 也 可 以 通过 下 面 一 种 方法 来 加 以 区 分 : 即 为 所 有 可 执行 的 二 进 制 
代码 预先 加 上 前 级 或 者 是 引导 信息 。 这 样 ， 当 程 序 装载 器 从 磁盘 中 读 取 程序 时 ， 就 可 以 让 它 知 道 其 
中 的 选择 。 

当 可 重新 定位 的 程序 代码 被 装 到 内 存 时 ， 通常 会 有 一 个 专用 寄存 器 为 该 程序 提供 一 个 基地 址 。 随 
后 ， 程序 中 所 有 地 址 都 会 被 认为 是 偏离 存放 在 该 寄存 器 中 的 基 表 8-3 ”使 用 基地 址 寄存 器 从 地 址 
地 址 的 偏 移 量 。 在 表 8-1 中 ， 说 明了 程序 装载 器 是 如 何 从 地 址 250h 开始 装 入 程序 时 的 内 存 图 像 
0250h 开始 装 入 程序 代码 的 。 这 里 ， 实 际 的 系统 会 简单 地 把 
0250 存放 在 程序 的 基地 址 寄存 器 中 ， 并 且 直 接 使 用 这 个 程序 
而 无 需 修 改 ， 如 表 8-3 所 示 。 显 然 ， 在 加 上 基地 址 寄存 器 中 的 
数值 0250 后 ， 每 个 操作 数 的 地 址 都 变 成 有 效 地 址 。 

不 管 是 使 用 可 重新 定位 的 代码 还 是 不 可 重新 定位 的 代码 ， 
程序 的 指令 和 数据 都 必须 与 实际 的 物理 地 址 关联 (或 绑 定 ) 。 
将 指令 和 数据 绑 定 到 存储 器 地 址 的 过 程 可 以 在 编译 时 ， 装载 
时 ， 或 者 执行 时 进行 。 绝对 代码 就 是 编译 时 绑 定 (compile- 
time binding) 的 一 个 例子 。 这 里 ， 指令 和 数据 的 引用 在 程序 
编译 时 就 和 物理 地 址 绑 定 在 一 起 。 只 有 在 预先 知道 一 个 进程 映像 ( 即 程序 在 存储 器 中 的 存放 图 像 ) 被 
如 何 装载 到 存储 器 单元 的 情况 下 ， 编译 时 绑 定 才 会 起 作用 。 然 而 ， 对 于 编译 时 绑 定 而 言 ， 如 果 进 程 映 
像 的 起 始 位 置 发 生 改 变 ， 那么 必须 重新 编译 整个 程序 的 代码 。 假如 编译 时 我 们 并 不 知道 进程 映像 装 入 
存储 器 的 具体 位 置 ， 那么 就 要 生成 可 重新 定位 的 代码 。 这 种 代码 可 以 在 装载 时 或 者 是 运行 时 绑 定 实际 
的 物理 存储 器 地 址 。 在 将 二 进 制 代码 模块 装载 到 存储 器 时 ， 对 于 每 次 代码 地 址 的 引用 ， 装 载 时 绑 定 
(load-time binding) 都 会 添加 进程 映像 的 起 始 地 址 。 但 是 ， 由 于 整个 进程 的 起 始 地 址 必须 保持 相同 ， 
所 以 这 种 装载 时 绑 定 的 进程 映像 在 执行 过 程 中 不 能 移动 。 运行 时 绑 定 《run-time binding)， 或 者 称 为 执 
行 时 绑 定 (execution-time binding)， 是 指 直到 进程 实际 运行 时 才 对 程序 代码 的 物理 地 址 进行 绑 定 。 运 
行 时 绑 定 允 许 进程 映像 在 运行 时 可 以 从 一 个 内 存 地 址 转移 到 另 一 个 内 存 地 址 。 运行 时 绑 定 需要 有 专门 
的 硬件 支持 地 址 映射 (address mapping)， 或 者 说 是 将 逻辑 地 址 转换 为 物理 地 址 。 这 里 ， 需要 采用 一 个 
专门 的 基地 址 寄存 器 来 存放 程序 的 起 始 ( 首 ) 地 址 。 然 后 ， 在 CPU 所 生成 的 每 次 引用 中 都 会 加 入 这 个 
起 始 地 址 。 如 果 某 个 进程 映像 发 生 了 移动 ， 就 会 更 新 基地 址 寄存 器 的 内 容 来 反映 该 进程 起 始 地 址 的 变 
化 。 如 果 要 快速 实行 这 种 地 址 转换 操作 ， 必须 增加 额外 的 虚拟 存储 器 的 硬件 。 
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8. 4.2 链接 编辑 器 


在 大 多 数 计算 机 系统 中 ， 程 序 编译 器 的 输出 结果 必须 首先 通过 一 个 链接 编辑 器 (link editor， 或 称 
为 目标 代码 链接 器 ， 简 称 链接 器 ，linker) 进行 通读 ， 然 后 才能 在 目标 系统 上 执行 。 链 接 过 程 是 将 程序 
的 外 部 符号 与 来 自 其 他 文件 的 所 有 输出 符号 进行 匹配 ， 生 成 一 个 不 包含 未 解析 的 外 部 符号 的 单一 二 进 
制 文件 。 链 接 器 的 主要 工作 是 将 相关 的 程序 文件 组 合成 一 个 统一 的 可 装载 的 模块 ， 如 图 8-6 所 示 。 图 
中 的 举例 使 用 的 是 DOS/Windows 环境 下 的 文件 扩展 名 。 构 成 模块 的 各 个 二 进 制 文件 可 以 是 完全 由 用 
户 编写 的 〈user-written)， 也 可 以 是 由 标准 的 系统 例 行 程序 组 合 而 成 的 ， 这 主要 取决 于 应 用 程序 的 需 


求 。 另 外 ， 二 进 制 链接 器 的 输入 可 以 由 任何 一 个 编译 器 产生 。 除 此 之 外 ,链接 过 程 还 允许 程序 的 不 同 
段落 部 分 使 用 不 同 编程 语言 来 编写 。 因 此 ， 为 了 编码 方便 起 见 ， 程 序 的 某 一 部 分 采用 C++ 语言 编写 ， 


而 另 一 部 分 可 以 使 用 汇编 语言 编写 ， 这 样 能 够 加 速 执行 速度 特别 慢 的 程序 部 分 。 
区 
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图 8-6 链接 和 装载 二 进 制 代码 模块 
在 使 用 汇编 程序 时 ， 大 多 数 链 接 编辑 器 都 需要 两 次 通读 才能 生成 包含 所 有 外 部 输入 模块 的 一 个 完全 
的 装载 模块 。 在 第 一 次 通读 过 程 中 ， 链 接 器 生成 一 个 全 局 外 部 符号 表 ， 表 中 包含 每 个 外 部 模块 的 名 称 和 
这 些 外 部 模块 关于 整个 链接 模块 开始 处 的 相对 起 始 地 址 。 在 第 二 次 通读 过 程 中 ， 所 有 模块 〈 原 来 这 些 模 
块 都 是 分 立 的 外 部 模块 ) 之 间 的 引用 会 被 来 自 符号 表 中 的 这 些 模 块 位 移 量 所 取代 。 在 链接 器 的 第 二 次 通 
读 过 程 中 ， 与 平台 相关 的 代码 也 会 被 加 入 这 个 组 合 模块 中 ， 生 成 一 个 统一 的 和 可 装载 的 二 进 制程 序 文件 。 


8. 4.3 动态 链接 库 


有 些 操作 系统 ， 例 如 著名 的 Microsoft Windows， 在 生成 可 执行 模块 之 前 并 不 需要 对 程序 中 使 用 的 
所 有 过 程 都 进行 链接 编辑 。 如 果 在 源 程序 中 使 用 适当 的 程序 语法 ， 某 些 特 定 的 外 部 模块 就 可 以 在 执行 
时 再 进行 链接 。 因 为 这 种 链接 过 程 只 是 在 程序 或 模块 的 首次 调用 时 进行 ， 所 以 这 类 外 部 模块 被 称 为 动 
态 链接 库 (dynamic link libraries，DLL)。 动 态 链 接 过 程 的 示意 图 如 图 8-7 所 示 。 当 每 个 过 程 被 装 人 
后 ， 过 程 的 地 址 就 会 被 放置 到 位 于 主 程序 模块 中 的 交叉 引用 表 (cross-reference table) 中 。 

这 种 方法 有 很 多 好 处 。 第 一 ， 多 个 程序 反复 使 用 某 个 外 部 模块 ， 那 么 静态 链接 会 要 求 每 个 引用 的 
程序 都 要 包含 这 个 外 部 模块 的 二 进 制 代码 的 一 个 副本 。 一 段 相 同 程序 代码 有 多 份 副本 分 散在 各 个 程序 
之 中 ,显然 是 对 磁盘 空间 的 一 种 浪费 。 因 此 ， 在 执行 时 进行 链接 的 方式 将 节省 磁盘 空间 。 动态 链接 的 
第 二 个 好 处 是 : 如 果 外 部 模块 的 代码 内 容 发 生 了 变化 ， 那 么 每 个 与 这 个 外 部 模块 链接 的 模块 都 不 需要 
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图 8-7 带 有 装载 时 地 址 解析 的 动态 链接 
重新 进行 链接 来 保持 程序 的 完整 性 。 另外 ， 要 跟踪 记录 哪些 模块 在 使 用 哪些 特定 的 模块 是 非常 困难 的 
事情 ， 对 于 大 型 系统 来 说 ， 甚 至 是 不 可 能 的 。 第 三 ， 动 态 链接 提供 了 一 些 方法 ， 第 三 方 可 以 利用 这 些 
方法 来 创建 一 些 通用 库 ， 例 如 由 为 某 个 特定 系统 编写 程序 的 程序 员 来 生成 这 样 的 通用 库 。 换 句 话 说 ， 
如 果 你 正在 为 某 个 特定 的 操作 系统 编写 程序 ， 那 么 可 以 授权 在 每 台 运 行 这 种 操作 系统 的 计算 机 上 使 用 
某 些 特定 的 通用 库 。 你 自己 不 必 关 心 这 个 操作 系统 的 版 本 号 、 修 补 程度 ,或 者 是 其 他 一 些 可 能 经 常 发 
生变 化 的 东西 。 只 要 没有 删除 这 个 通用 库 ， 就 可 以 使 用 它 来 进行 动态 链接 。 

动态 链接 过 程 可 以 在 装载 程序 或 者 某 个 正在 运行 的 程序 首次 调用 一 个 未 链接 过 程 时 发 生 。 在 装载 
时 进行 动态 链接 会 造成 程序 启动 的 延迟 。 这 时 ， 操 作 系统 不 是 简单 地 从 磁盘 中 读 取 程 序 的 二 进 制 代码 
并 运行 它 。 现 在 操作 系统 不 仅 要 装载 主 程序 ， 而 且 还 要 装载 该 程序 使 用 的 所 有 模块 的 二 进 制 代码 。 在 
执行 第 一 个 程序 语句 之 前 ， 装 载 器 (程序 ) 要 为 主 程序 提供 每 个 模块 的 装载 地 址 。 对 于 某 些 应 用 程序 
来 说 ， 如 果 在 用 户 调用 该 程序 和 程序 实际 开始 执行 之 间 存在 着 时 间 上 的 延迟 是 不 能 接受 的 。 男 一 方面 ， 
运行 时 链接 (run-time linking) 不 会 导致 装载 时 链接 (load-time linking) 的 启动 开销 ， 即 启动 时 的 时 
间 延 迟 ， 因 为 一 个 模块 仅仅 在 被 调用 时 才 会 被 链接 。 这 样 就 可 以 节省 大 量 的 工作 ， 因 为 相对 而 言 实际 
上 只 调用 为 数 不 多 的 模块 。 然 而 ， 当 一 个 程序 频繁 地 停顿 下 来 去 装载 某 些 库 程序 时 ， 有 些 用 户 却 拒 绝 
去 感知 这 种 不 规则 的 反应 时 间 。 

有 关 动 态 链接 的 另外 一 个 不 太 明 显 的 问题 是 ， 编 写 模块 的 程序 员 不 能 直接 控制 动态 链接 库 程 序 的 
内 容 。 因 此 ， 如 果 链 接 库 代码 的 编写 者 决定 要 改变 其 功能 ， 可 以 进行 这 种 修改 过 程 而 无 需 得 到 库 的 使 
用 者 的 认 知 或 同意 。 此 外 ,任何 编写 过 商业 程序 的 人 都 知道 ， 这 些 库 程 序 的 少许 变化 可 能 会 在 整个 系 
统 中 引起 连锁 反应 。 这些 反应 的 后 果 可 能 是 破坏 性 的 ， 而 且 很 难 追 查 它 的 根源 。 幸 运 的 是 ， 这 种 奇怪 
的 现象 非常 少 。 因 此 ， 在 各 种 操作 系统 上 发 布 商业 的 二 进 制 代码 程序 时 ， 使 用 动态 链接 仍然 是 一 种 大 
家 所 喜爱 的 方法 。 


8.4.4 编译 器 


汇编 语言 编程 可 以 完成 许多 高 级 编程 语言 不 能 实现 的 功能 。 首 先 最 重要 的 一 点 是 ， 汇 编 语 言 允 许 
程序 员 直 接 访问 下 面 的 计算 机 硬件 结构 。 用 于 控制 的 程序 和 与 外 设 进行 通信 的 程序 ， 通常 都 是 用 汇编 
语言 编写 的 ,原因 是 汇编 语言 通常 具有 一 些 高 级 语言 所 没有 的 专用 指令 。 例 如 ， 程 序 员 可 以 不 依赖 操 
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作 系 统 的 服务 直接 控制 通信 端口 。 使 用 汇编 语言 ， 可 以 让 计算 机 做 任何 事情 ， 甚 至 是 操作 系统 所 有 提 
供 的 服务 。 尤 其 是 程序 员 常常 使 用 汇编 语言 来 操作 一 些 专用 硬件 ， 因 为 高 级 语言 的 编译 器 并 不 是 设计 
来 处 理 不 通用 或 者 是 不 常用 的 设备 。 而 且 ， 精 心 编写 的 汇编 代码 的 运行 速度 极 快 。 每 条 原始 指令 都 可 
以 进行 精心 优化 ， 这 样 汇编 指令 可 以 在 系统 上 产生 最 适时 和 最 有 效 的 行为 。 

但 是 ， 尽 管 汇编 语言 具有 这 些 优点 ， 但 是 在 普通 的 应 用 程序 开发 中 ， 并 不 鼓励 人 们 使 用 汇编 语言 。 
事实 上 ， 使 用 汇编 语言 编程 非常 困难 ， 而 且 容 易 出 错 。 汇 编 语 言 程 序 的 维护 甚至 要 比 程序 的 编写 更 加 
困难 ， 特 别 是 如 果 负 责 维护 的 程序 员 不 是 程序 代码 的 编写 者 时 。 最 重要 的 是 ， 汇 编 语言 不 能 移植 到 不 
同 的 机 器 结构 上 。 因 为 这 些 原因 ， 大 多 数 通 用 系统 软件 都 很 少 使 用 或 者 不 使 用 汇编 指令 。 汇 编 代 码 仅 
仅 是 在 非常 必需 时 才 使 用 。 

现在 ， 所 有 系统 程序 和 应 用 程序 实际 上 几乎 都 使 用 高 级 语言 ， 很 少 有 例外 。 当 然 , “高 级 〈higher- 
level)” 是 一 种 相对 的 术语 ， 常 常 容易 产生 误解 。 一 种 大 家 都 可 以 接受 的 编程 语言 分 类 法 是 从 将 二 进 制 的 
机 器 代码 称 为 “第 一 代 (first-generation)” 的 计算 机 语言 (1GL) 开始 的 。 在 使 用 第 一 代 计 算 机 语言 
-(1GL) 之 前 ， 程 序 员 需 要 利用 计算 机 控制 台 上 的 连接 开关 直接 把 程序 指令 输入 计算 机 。 后 来 ， 越 来 越 多 
的 “特权 〈privileged)” 用 户 们 把 二 进 制 指令 打 孔 到 纸 带 或 卡片 上 。 在 20 世纪 50 年 代 早期 ， 出 现 了 第 一 
个 汇编 程序 ， 这 大 大 地 提高 了 编程 效率 。 这 些 第 二 代 语 言 (2GL) 消除 了 由 于 使 用 人 工 方法 将 指令 翻译 
成 机 器 代码 而 产生 的 错误 。 到 了 20 世纪 50 年 代 后 期 ， 引 进 了 可 以 编译 的 符号 语言 ， 或 称 为 “第 三 代 
(third-generation)” 语 言 (3GL) ， 从 而 再 次 大 幅度 提高 了 编程 的 效率 。 在 1957 年 ，John Backus 和 他 的 
]BM 团队 发 布 的 FORTRAN (Formula Translation) 语言 是 第 一 个 第 三 代 语言 。 从 此 ， 真 正 的 字母 类 第 三 
代 语 言 在 程序 设计 领域 大 量 涌现 。 在 这 些 第 三 代 语 言 中 ， 有 些 是 使 用 首 字母 来 命名 的 ， 例 如 COBOL、 
SNOBOL 和 COOL 语言 。 而 有 些 是 以 人 物 来 命名 的 ， 例 如 Pascal 和 Ada 语言 。 另 外 ， 还 有 一 些 第 三 代 庄 
言 是 根据 语言 设计 者 的 喜好 来 称呼 的 ， 例 如 C 语 言 、C++ 语 言 和 JAVA 语言 。 

“每 一 代 ” 程 序 设 计 语 言 都 与 当时 人 们 如 何 思考 问题 和 机 器 如 何 解 决 这 些 问题 密切 相关 。 有 些 第 四 代 
和 第 五 代 编程 语言 非常 容易 使 用 ， 以 至 于 现在 的 程序 设计 任务 已 经 不 再 像 以 前 那样 要 求 有 经 过 训练 的 专 
， 业 程序 员 ， 普 通 的 计算 机 最 终 用 户 就 可 以 很 方便 地 完成 。 这 其 中 关键 的 思想 是 ， 用 户 只 需要 告诉 计算 机 
做 什么 ， 而 不 再 需要 告诉 计算 机 如 何 去 做 ， 因 为 接 下 来 就 可 以 由 编译 器 来 完成 剩 下 的 工作 。 为 了 方便 用 
户 使 用 ， 最 新 的 程序 设计 语言 为 计算 机 系统 提供 了 更 多 的 管理 开销 。 最 后 ， 由 于 实际 工作 的 数字 系统 硬 
件 只 能 执行 二 进 制 代码 ， 因 此 所 有 指令 都 必须 通过 这 种 语言 分 层 结 构 向 下 转换 成 对 应 的 机 器 诸 言 指令 。 

在 第 4 章 中 ， 我 们 曾经 指出 汇编 语言 的 语句 与 机 器 实际 运行 的 二 进 制 代码 之 间 存 在 一 一 对 应 的 关 
系 。 而 在 编译 语言 程序 中 ， 这 变 成 了 一 种 一 对 多 的 对 应 关系 。 例 如 ， 考 虑 变量 存储 定义 ， 对 于 高 级 诸 
言语 句 ，x= 3* Y， 在 MARIE 模型 的 汇编 语言 中 将 至 少 需要 用 12 条 语句 来 表示 。 随 着 源 程 序 诸 言 
复杂 度 的 增加 ， 源 代码 指令 数目 和 对 应 的 二 进 制 机 器 指令 数目 的 比率 变 得 越 来 越 小 。 语 言 的 层次 “ 越 
高 ?， 每 条 高 级 语句 所 对 应 生成 的 机 器 指令 数 就 越 多 。 编 程 语言 层次 结构 中 的 这 种 关系 如 图 8-8 所 示 。 
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自从 20 世纪 50 年 代 末 出 现 了 第 一 个 编译 器 后 ， 编 译 器 技术 得 到 了 迅速 发 展 。 通 过 编译 器 结构 的 
发 展 成 就 ， 软 件 工程 科学 已 经 证 明 编 译 器 能 够 把 看 似 非常 束 手 的 问题 变 成 普通 程序 设计 任务 。 这 种 间 
题 的 复杂 性 主要 在 于 如 何 连 接 人 们 理解 的 程序 语言 与 机 器 理解 的 程序 语言 之 间 所 存在 的 语义 上 间隙 ，。 

大 多 数 编译 器 都 使 用 一 个 6 阶段 (six-phase) 过 程 来 实现 这 种 代码 转换 ， 如 图 8-9 所 示 。 代 码 编 
译 的 第 一 步 为 词法 分 析 (lexical analysis)， 目 的 
是 从 一 个 文本 结构 的 源 代码 流 中 抽取 一 些 有 意义 
的 语言 原 语 ， 或 者 是 标记 符号 〈token) 。 这 些 标 
记 符 号 由 特定 的 编程 语言 中 的 保留 字 (例如 站、 
else) 、 布 尔 操 作 符 和 数学 操作 符 、 文 字 〈 例 如 
12. 27) 和 程序 员 定 义 的 变量 组 成 。 当 词法 分 析 
器 在 创建 标记 符号 流 时 ， 也 同时 在 为 符号 表 构建 
框架 。 这 时 ， 符 号 表 中 很 可 能 包含 用 户 定义 的 标 
记 符号 〈 变 量 和 过 程 名 ) ， 以 及 说 明 这 些 标记 符 
号 位 置 和 数据 类 型 的 注解 。 如 果 在 源 代 码 中 发 现 
有 该 语言 不 能 识别 的 字符 和 结构 时 ， 就 会 出 现 词 
法 错误 。 例 如 ， 程 序 员 定义 的 变量 1Dayspay， 
在 大 多 数 编程 语言 中 将 会 发 生词 法 错误 ， 因 为 变 
量 名 通常 不 能 以 数字 开头 。 如 果 没 有 发 现 词法 错 
误 ， 编 译 器 将 继续 分 析 标 记 符号 流 的 语法 问题 。 图 8-9 程序 编译 的 6 个 阶段 

标记 符号 流 的 语法 分 析 (syntax analysis 或 
parse) 的 过 程 包括 创建 一 种 称 为 分 析 树 (parse tree， 或 称 为 语法 树 ，syntax tree) 的 数据 结构 。 无 序 
遍历 某 个 分 析 树 通常 可 以 给 出 刚 遍 历 过 的 表达 式 。 例 如 ， 考 虑 下 面 的 程序 语句 : 


monthPrincipal = payment- (outstandingBalance * interestRate) 


这 个 语句 的 一 个 正确 的 语法 树 如 图 8-10 所 示 。 

语法 分 析 器 会 检查 符号 表 中 现 有 的 位 于 分 析 树 上 的 程序 员 
定义 的 变量 。 如 果 分 析 器 发 现 一 个 在 符号 表 中 没有 其 描述 信息 © 
的 变量 ， 会 发 出 一 个 出 错 信 息 。 语 法 分 析 器 同样 也 会 检查 不 合 
法 的 结构 ,例如 A 一 B 十 C 一 D。 然 而 ， 语 法 分 析 器 不 会 检查 月 突 本 © 
“一 ”或 “十 ”这 些 操作 符 对 于 变量 A、B、C 和 DD 是 否 正确 有 
效 。 这 些 工作 将 在 下 一 阶段 由 语义 分 析 器 (semantic analyzer) 支出 人 
完成 。 语 义 分 析 器 使 用 语法 分 析 树 作为 输入 ， 并 利用 从 符号 表 
中 读 取 信息 来 检查 输入 的 数据 类 型 是 否 正确 。 语 义 分 析 器 也 可 收 支 平生 利率 
以 进行 正确 的 数据 类 型 升级 。 例 如 ， 将 一 个 整 型 数据 转换 为 浮 图 8-10 语法 分 析 树 
点 数值 或 变量 ， 条 件 是 只 要 语言 规则 支持 这 种 转换 即 可 。 

在 完成 分 析 功 能 后 ， 编 译 器 将 使 用 来 自 语义 分 析 阶 段 的 语法 树 开始 其 综合 阶段 。 代 码 综合 的 第 一 
步 是 从 语法 树 中 创建 伪 汇 编 (pseudo-assembly) 代码 。 这 种 代码 通常 称 为 3 地 址 代码 (three-address 
code) ， 央 为 它 支 持 像 A= B+ C 这 类 的 语句 ， 而 大 多 数 汇编 语言 都 不 支持 这 种 语句 。 这 种 中 间 代 码 使 得 
编译 器 可 以 在 许多 种 不 同 的 计算 机 系统 上 移植 。 

一 旦 所 有 的 标记 符号 流 分 析 、 构 建 分 析 树 和 语义 分 析 的 工作 完成 后 ， 下 一 步 的 工作 变 得 相对 容易 
一 些 。 主 要 是 编写 一 个 3 地 址 的 代码 翻译 器 ， 它 可 以 为 许多 不 同 的 指令 集 产生 一 个 输出 。 大 多 数 计 算 
机 的 指令 系统 (ISA) 都 使 用 2 地 址 指令 代码 ， 所 以 在 代码 的 转换 过 程 中 必须 解决 编 址 方式 的 差异 问 
题 。 读 者 可 以 回忆 一 下 ，MARIE 模型 中 的 指令 集 是 一 个 1 地 址 的 体系 结构 。 然 而 ， 编 译 器 在 最 后 阶段 
的 工作 通常 不 仅仅 是 把 中 间 代 码 翻 译 成 汇编 指令 代码 。 好 的 编译 器 会 尝试 对 指令 代码 进行 优化 。 在 优 
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化 过 程 中 ， 编 译 器 通常 可 以 考虑 不 同 的 存储 器 和 寄存 器 的 组 织 结构 ， 并 提供 执行 任务 所 需 的 功能 最 强 
大 的 指令 。 代 码 优化 过 程 同样 也 会 涉及 到 移 除 不 必要 的 临时 变量 ， 将 重复 的 表达 式 整 合 为 一 个 单一 表 
达 式 ， 而 且 还 要 标记 无 效 〈 不 可 到 达 ) 的 死 代 码 。 

在 完成 所 有 的 指令 生成 和 可 能 的 优化 作业 后 ， 编 译 器 会 生成 适合 在 目标 系统 上 进行 链接 和 运行 的 
二 进 制 目 标 代 码 。 


8.4.5 解释 器 


与 编译 语言 一 样 ， 解 释 语 言 在 源 代码 和 可 执行 的 机 器 指令 之 间 也 存在 着 一 对 多 关系 。 但 是 ,与 编 
译 器 不 同 的 是 ， 解 释 程 序 一 次 只 处 理 一 条 源 代 码 的 程序 语句 。 而 编译 器 却 在 产生 一 个 二 进 制 的 代码 流 
之 前 ， 需 要 通读 整个 源 代 码 文件 。 

正 因 为 有 如 此 多 的 工作 都 是 “即时 (on the fiy)” 完 成 的 ， 所 以 解释 程序 的 工作 速度 要 比 编译 器 慢 
得 多 。 编 译 器 所 要 求 的 6 个 工作 步 又 中 至 少 有 5 个 步骤 同样 也 必须 在 解释 程序 上 执行 ， 而 且 这 些 步骤 
都 是 被 “实时 ”地 执行 。 这 种 方法 不 可 能 提供 代码 优化 的 过 程 。 另 外 ， 解 释 程 序 中 的 错误 检测 通常 也 
仅 限于 语言 语法 和 变量 类 型 的 检查 。 例 如 ， 很 少 有 解释 程序 可 以 在 错误 发 生前 检测 出 可 能 的 非法 算术 
运算 ， 或 者 能 够 在 变量 值 超越 数组 界限 之 前 就 提出 警告 。 

一 些 早期 的 编译 器 ， 如 某 些 著 名 的 BASIC 编译 器 ， 在 定制 的 编辑 器 中 提供 了 语法 检查 功能 。 例 
如 ， 如 果 用 户 将 “else” 输 入 成 “esle"， 编 辑 器 会 立即 对 这 一 输入 结果 做 出 标记 。 另 外 一 些 解释 程 
序 允 许 用 户 使 用 普通 的 文本 编辑 器 编辑 程序 ， 最 后 等 到 程序 执行 时 才 进 行 语 法 检查 。 后 一 种 方法 在 用 
于 一 些 关键 性 的 商业 应 用 程序 时 会 有 很 大 风险 。 如 果 应 用 程序 恰好 执行 到 一 段 尚未 进行 正确 的 语法 检 
查 的 代码 分 支 结 构 时 ， 该 程序 会 发 生 册 演 。 而 留 给 用 户 的 可 能 是 一 个 他 所 不 愿意 看 到 的 系统 命令 提示 
符 ， 这 时 用 户 的 文件 可 能 只 更 新 了 部 分 内 容 。 

虽然 具有 很 慢 的 执行 速度 和 延期 的 出 错 检查 的 缺点 ,但 是 我 们 还 是 有 很 多 理由 使 用 解释 语言 。 其 
中 最 重要 的 一 点 是 : 解释 语言 允许 用 户 进行 源 程 序 级 (source-level) 的 调试 ， 这 样 解释 诸 言 非常 适合 
于 编程 初学 者 和 最 终 用 户 。 这 也 就 是 在 1964 年 两 位 英国 Dartmouth 的 教授 John G. Kemeny 和 Thomas 
E. Kurtz 为 什么 发 明了 BASIC 语言 的 原因 。BASIC 即 为 初学 者 通用 符号 指令 代码 (Beginners All-pur- 
pose Symbolic Instruction Code)。 那 时 ， 学 生 们 通常 的 第 一 个 编程 经 历 是 将 FORTRAN 程序 指令 穿孔 
到 一 些 80 列 的 卡片 上 。 然 后 ， 再 把 这 些 卡 片 放 到 一 个 大 型 计算 机 的 编译 器 上 运行 ,通常 这 一 过 程 需要 
几 个 小 时 。 有 时 ， 为 了 得 到 一 个 明确 的 编译 和 执行 结果 甚至 需要 几 天 。 与 采用 批 处 理 模式 编译 程序 的 
方式 完全 不 同 ，BASIC 语言 允许 学 生 在 一 个 交互 式 终端 的 会 话 环 境 中 键 人 程序 代码 。 一 直 在 主机 上 运 
行 的 BASIC 解释 程序 会 立即 对 学 生 的 操作 给 出 反馈 信息 。 这 样 ， 学 生 能 够 迅速 纠正 各 种 语法 错误 和 四 
辑 错 误 ， 从 而 提高 学 习 的 积极 性 和 效率 。 

基于 这 些 相同 的 理由 ，BASIC 语言 是 早期 个 人 计算 机 系统 上 优先 选择 的 一 种 编程 语言 。 当 时 ， 许 
多 在 第 一 时 间 购 买 计算 机 的 用 户 都 不 是 有 经 验 的 编程 人 员 ， 所 以 他 们 需要 一 种 可 以 轻松 学 会 计算 机 编 
程 的 语言 。BASIC 语言 就 是 能 够 满足 这 种 目的 的 一 种 理想 选择 。 而 且 ， 在 单 用 户 的 个 人 计算 机 系统 
上 ， 很 少 有 人 会 在 意 BASIC 解释 语言 的 执行 速度 比 编译 语言 慢 得 多 。 


8.5 Java : 一 种 综合 语言 


在 20 世纪 90 年 代 初 期 ，James Gosiing 博士 和 他 领导 的 Sun 公司 的 研究 团队 开始 研发 一 种 可 以 在 
任意 计算 机 平台 上 运行 的 编程 语言 。 他 们 的 目标 是 创造 一 种 “编写 一 次 ， 到 处 运行 (write once，run- 
anywhere)” 的 计算 机 语言 。1995 年 ，Sun 公司 发 布 了 Java 编程 语言 的 第 一 个 版 本 。 由 于 具有 可 移植 
性 和 开放 的 规范 标准 ，Java 语言 变 得 非常 流行 。Java 语言 的 程序 代码 几乎 可 以 在 从 最 小 型 的 掌上 设备 
到 大 型 计算 机 系统 的 所 有 计算 机 平台 上 运行 。Java 语言 是 基于 因特网 的 大 范围 商业 活动 开始 出 现时 应 
运 而 生 的 跨 平 台 语 言 。Java 语言 是 一 种 理想 的 跨 平台 计算 模型 。 虽 然 本 书 在 第 5 章 中 简要 介绍 了 Java 
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语言 及 其 一 些 基 本 特性 ， 但 是 在 这 里 我 们 将 进行 更 加 深入 的 讨论 。 

对 于 曾 学 习 过 Java 编程 语言 的 人 来 说 ， 应 该 知道 Java 编译 器 的 输出 是 一 个 二 进 制 的 类 (class) 文 
件 。 这 种 类 文件 可 以 由 一 个 Java 虚拟 机 (Java Virtual Machine，JVM) 来 执行 ，Java 虚拟 机 在 很 多 方 
面 类 似 于 实际 的 计算 机 。Java 虚拟 机 拥有 一 个 只 能 由 该 机 器 中 运行 的 进程 寻 址 的 专用 存储 器 空间 。 它 
还 有 真正 〈bona fide) 属于 它 自 己 的 指令 系统 。 这 个 指令 系统 〈ISA) 是 一 个 基于 堆栈 的 体系 结构 。 这 
种 指令 系统 使 得 虚拟 机 变 得 非常 简单 ， 而 且 实际 上 它 可 以 移植 到 任何 计算 平台 上 。 

当然 ，Java 虚拟 机 并 不 是 一 个 真实 的 计算 机 。 事 实 上 ， 它 是 位 于 操作 系统 和 应 用 程序 〈 二 进 制 的 
类 文件 ) 之 间 的 一 个 软件 层 。 类 文件 包含 各 种 变量 和 操作 这 些 变 量 的 方法 〈method) 。 

图 8-11 给 出 了 JVM 如 何 构成 一 个 具有 自己 的 存储 器 和 方法 区 的 微型 计算 机 器 。 注 意 : 存储 器 堆 
集 、 方 法 代码 和 本 机 方法 接口 (native method interface) 区 是 由 所 有 运行 在 该 机 器 上 的 进程 所 共享 的 。 


本 机 方法 接口 
(连接 其 他 语言 编写 
的 程序 的 接口 ) 





图 8-11 Java 虚拟 机 

存储 器 堆 集 (heap〉 是 一 个 主 存储 器 空间 。 当 通过 线程 的 执行 而 产生 和 消灭 各 种 数据 结构 时 会 对 
这 些 存储 器 堆 集 进行 空间 分 配 和 取消 空间 分 配 。Java 中 取消 堆 集 存储 器 的 分 配 通 常 称 为 垃圾 回收 
(garbage collection)， 垃 圾 回收 由 JVM (代替 操作 系统 ) 自动 完成 。Java 的 本 机 方法 区 (native meth- 
od area) 为 非 Java 的 二 进 制 对 象 提供 工作 场所 ,例如 编译 过 的 C+ 十 ， 或 者 是 汇编 语言 的 模块 。JVM 
的 方法 区 (method area) 包括 运行 驻 留 在 JVM 中 的 每 个 应 用 线程 所 需 的 二 进 制 代码 。 这 也 正 是 类 变 
量 数据 结构 和 由 类 所 要 求 的 程序 语句 驻 留 的 地 方 。Java 语言 的 可 执行 程序 语句 用 一 种 称 为 字 节 码 (by- 
tecode) 的 中 间 代 码 来 保存 ， 这 在 第 5 章 中 也 做 了 介绍 。 

Java 方法 的 字 节 码 在 各 种 不 同 线程 中 被 行 。 有 几 个 线程 是 由 JVM 自动 启动 的 ， 其 中 包括 主 程序 线 
程 。 在 每 个 线程 中 一 次 只 能 激活 一 种 方法 ， 而 多 个 程序 可 以 产生 多 个 额外 的 线程 来 并 发 执行 。 当 一 个 
线程 调用 某 种 方法 时 ， 会 为 该 方法 创建 一 个 存储 器 帧 。 这 个 存储 器 帧 的 一 部 分 空间 用 来 保存 该 方法 的 
局 部 变量 ， 另 一 部 分 用 作 该 方法 的 专用 堆栈 。 在 线程 已 经 定义 了 方法 堆栈 之 后 ， 该 线程 就 会 把 该 方法 
的 各 个 参数 压 人 堆栈 ， 并 将 程序 计数 器 指向 该 方法 中 的 第 一 条 可 执行 语句 。 

每 个 Java 类 都 包含 一 种 称 为 常数 池 (或 称 为 常数 存储 库 ，constant pool) 的 符号 表 。 常 数 池 是 一 
个 数组 ， 其 中 包含 某 一 类 的 各 种 变量 的 所 有 数据 类 型 和 各 变量 的 初始 值 ， 以 及 各 变量 的 访问 标志 〈 例 
如 ， 对 于 这 个 类 来 说 ， 该 变量 是 公共 变量 还 是 专用 变量 )。 常 数 池 中 还 包含 一 些 不 是 程序 员 定义 的 结 
构 。 这 也 就 是 为 什么 Sun 公司 将 常数 池 (数组 元 素 ) 中 的 人 日 条 目 称 为 属性 (attribute) 的 缘故 。 在 
每 个 Java 类 的 属性 中 ， 我 们 会 发 现 一 些 Java 处 理 内 部 事务 的 项 目 如 Java 源 文 件 的 名 称 ，Java 类 的 继 
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承 结构 体 部 分 和 转向 其 他 JVM 内 部 数据 结构 的 指针 。 
为 了 说 明 JVM 如 何 执行 方法 字 节 码 ， 我 们 考虑 图 8-12 中 的 Java 程序 。 


public class Simple { 
public static void main (String[] args) { 
at A 
double j = 0; 
while (i < 10) { 


人 
j=j+1.0; 
} // while 
) // main() 
} // Simple() 


8-12 一 个 简单 的 Java 程序 
Java 需要 一 个 命名 为 Simple. java 的 文本 文件 ， 其 中 保存 这 个 类 的 源 代码 。Java 编译 器 会 读 取 
Simple. java 文件 ， 并 执行 其 他 编译 器 要 做 的 相同 工作 。Java 编译 器 的 输出 是 一 个 二 进 制 的 字 节 码 
流 ， 命 名 为 Simple. class。 这 个 Simple. class 文件 能 够 由 任何 具有 创建 该 类 的 编译 器 相同 版 本 或 
更 新 版 本 的 JVM 运行 。 这 些 步骤 如 图 8-13 所 示 。 








Java 文件 


8-13 Java 类 的 编译 和 执行 过 程 


在 执行 时 ，Java 虚拟 机 必须 在 一 个 主机 计算 机 系统 上 运行 。 当 JVM 装 和 人 一 个 类 文件 后 ， 首 先 要 验 
证 文件 的 完整 性 ， 包 括 检 查 类 文件 的 格式 和 字 节 码 指令 的 格式 ， 并且 要 确保 没有 不 合法 的 引用 。 在 这 
种 初步 的 验证 顺利 完成 后 ， 装 载 器 将 字 节 码 装 入 存储 器 ， 并 执行 一 系列 运行 时 的 检查 。 

完成 所 有 验证 步骤 后 ， 装 载 器 调用 字 节 码 解 释 器 。 解 释 器 将 有 如 下 6 个 步骤 任务 : 

1. 执行 字 节 码 指令 的 链接 编辑 ， 要 求 装载 器 提供 所 有 被 引用 的 类 和 系统 代码 (如果 它们 还 没有 被 
装 人 的 话 ) 。 

2. 创建 和 初始 化 主 堆栈 帧 和 局 部 变量 。 

3. 创建 和 启动 执行 线程 。 

4. 在 线程 执行 时 ， 通 过 取消 未 使 用 的 存储 器 分 配 来 管理 堆 集 存 储 器 。 

5. 当 每 个 线程 终结 时 ， 取 消 该 线程 的 资源 分 配 。 

6. 在 程序 终止 时 ， 取 消 所 有 剩余 的 线程 并 终止 JVM。 

图 8-14 给 出 了 类 文件 Simple. class 的 十 六 进 制 的 字 节 码 的 图 像 。 将 位 于 第 一 列 〈 阴 影 ) 中 的 数 
值 加 到 位 于 第 一 行 〈 阴 影 ) 中 的 偏 移 量 上 ， 即 可 得 到 每 个 字 节 的 地 址 。 为 了 方便 ， 我 们 已 经 把 字 节 码 
翻译 为 字符 ， 这 里 的 二 进 制 值 具 有 一 个 有 意义 的 7 位 ASCII 值 。 我 们 可 以 看 到 命名 为 Simple. java 的 
源 文件 是 从 地 址 06Dh 开始 。 而 类 名 始 于 地 址 080h。 熟 悉 Java 的 读者 都 知道 这 个 simple 类 也 被 认为 
是 .this 类。 而 其 超 类 (super-class) 是 java. lang. object， 其 名 称 开 始 于 地 址 089h。 

注意 ， 这 里 的 类 文件 以 十 六 进 制 数 CAFEBABE 开始 。 这 是 指示 一 个 类 文件 开始 的 魔术 数字 
(magic number)。 在 这 个 魔术 数字 的 后 面 紧 跟 着 一 个 8 字 节 序列 ， 表示 这 个 类 文件 的 语言 版 本 。 如 果 
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图 8-14 ”simple. class 的 二 进 制图 像 
这 个 序列 数 大 于 解释 JVM 所 能 支持 的 版 本 号 ， 那 么 验证 器 将 中 止 这 个 JVM。 

这 些 可 执行 的 字 节 码 从 地 址 0E6h 开始 。 地 址 0E5h 处 的 十 六 进 制 数 值 16 是 告诉 解释 程序 这 个 可 
执行 的 方法 字 节 码 的 长 度 为 22 字 节 。 在 汇编 语言 中 ， 每 个 可 执行 的 字 节 码 都 有 一 个 对 应 的 助 记 符 
(mnemonic)。 目 前 ，Java 语言 定义 了 204 个 不 同 的 字 节 码 指 令 。 因 此 ， 在 Java 中 只 需要 一 个 字 节 来 就 
可 以 表示 所 有 的 操作 码 。 这 种 小 的 操作 码 有 助 于 保持 较 小 的 Java 类 ， 这 样 使 得 这 些 类 可 以 在 主机 系统 
上 更 快 地 装载 和 更 方便 地 转换 为 二 进 制 指令 。 

因为 在 计算 机 程序 中 经 常 使 用 一 些小 的 常数 ， 所 以 Java 中 已 经 专门 定义 了 一 些 字 节 码 ， 用 于 在 需 
要 时 提供 这 些 常数 。 例 如 ， 助 记 符 iconst 5 表示 把 整数 5 压 人 堆栈 。 如 果 要 把 更 大 的 数 压 人 堆栈 ， 
需要 使 用 两 个 字 节 码 。 第 一 个 字 节 码 表示 操作 ， 而 第 二 个 表示 操作 数 。 我 们 在 前 面 曾 经 提 到 ， 每 个 类 
的 局 部 变量 都 保存 在 一 个 数组 中 。 从 特性 上 来 说 ， 数 组 中 位 于 前 面 的 几 个 元 素 是 最 活跃 的 ， 所 以 Java 
中 有 一 些 字 节 码 是 专门 针对 最 开始 的 几 个 局 部 数组 元 素 的 。 访 问 数组 中 位 于 其 他 位 置 的 元 素 需要 一 个 
2 字 节 的 指令 : 其 中 一 个 字 节 用 来 表示 操作 码 ， 第 二 个 用 来 表示 数组 元 素 的 偏 移 量 。 

按照 上 面 所 说 ， 我 们 考虑 Simple. class 的 main () 方法 的 字 节 码 。 从 图 8-14 中 提取 相关 的 字 
节 码 列 于 图 8-15 中 ， 并 且 添 加 相应 的 助 记 符 和 解 注 。 图 中 最 左边 一 栏 给 出 每 条 指令 的 相对 地 址 。 线 程 
专用 程序 计数 器 使 用 这 些 相 对 地 址 来 控制 程序 的 流程 。 我 们 现在 来 跟踪 这 个 字 节 码 的 执行 过 程 ， 看 它 
是 如 何 工作 的 。 

当 解 释 程序 开始 执行 这 个 代码 时 ， 会 将 PC 初始 化 设置 为 0， 并 执行 iconst_ 0 指令 。 这 是 执行 
simple. Java 程序 源 代码 中 的 第 三 行 语句 int i= 0。PC 自动 增 量 加 1， 接 着 会 执行 每 一 条 初始 化 指 
令 ， 直 到 第 4 条 指令 遇 到 goto 语句。 这 条 指令 将 一 个 十 进 制 数 11 加 到 程序 计数 器 中 ， 所 以 PC 的 值 
变 成 0Fh， 指 向 load_ 1 指令 。 

此 时 , JVM 已 经 为 1 和 j 分 配 了 初始 值 ， 并 接着 检查 while 循环 中 的 初始 条 件 以 判断 循环 体 是 否 
应 该 执行 。 为 此 ，JVM 会 将 从 局 部 变量 数组 中 提取 的 变量 i 的 数值 压 和 人 堆栈 中 ， 然 后 又 把 比较 值 0Ah 
压 人 堆栈 。 注 意 : 这 里 编译 器 已 经 为 我 们 做 了 少许 的 代码 优化 工作 。 在 默认 条 件 下 ，Java 利用 32 位 来 
保存 一 个 整数 ， 因 此 要 占用 4 个 字 节 。 然 而 ， 编 译 器 发 现 利用 一 个 字 节 足 以 保存 这 个 较 小 的 十 进 制 常 
数 10， 所 以 编译 器 就 编写 代码 只 将 一 个 字 节 压 人 堆栈 ， 而 不 是 压 人 4 个 字 节 。 

比较 操作 指令 if _ icmplt， 会 从 堆栈 中 弹出 1 和 0Ah， 并 比较 这 两 个 数值 。 这 个 助 记 符 后 面 的 1t 表示 
比较 操作 要 查找 小 于 (less than) 的 条 件 。 如 果 i 小 于 10， 就 将 PC 的 值 减 去 0Bh， 得 到 的 结果 7 也 就 是 循环 
体 的 起 始 地 址 。 当 这 个 循环 体 中 所 有 指令 都 完成 后 ， 执 行 过 程 回 到 地 址 0Fh 处 的 判断 条 件 处 理 语句 。 一 旦 
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这 个 判断 条 件 变 为 假 (false) 后 ， 解 释 程序 会 在 进行 清理 一 些 工作 后 ， 把 控制 权 交 还 给 操作 系统 。 


偏 移 量 
(PC 值 ) 





字 节 码 助 记 符 基文 





- ”变量 初始 化 


iconst 0 将 整数 0 压 人 堆栈 
下 从 堆栈 顶部 移 走 整数 并 放 到 局 部 变量 数组 的 地 址 1 处 
i 7 
一 | 下 而 的 再 个 字 维和 守节 
| | 0 | 0 | 表示 将 跳 过 接 下 来 的 11 个 字 节 


表示 将 数值 OB 加 到 程序 计数 器 
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将 双 精 度 常数 1 压 人 堆栈 


将 位 于 堆栈 顶部 的 两 个 双 精 度数 值 相 加 
从 堆栈 的 顶部 取出 双 精度 求 和 结果 存放 到 局 部 变量 数组 的 位 置 2 处 
循环 条 件 


iload 1 从 局 部 变量 数组 的 位 置 1 处 装 人 整数 


i 
bes a4 
二 

pe 
i DB 按照 “小 于 ”条 件 比 较 位 于 堆栈 顶部 的 两 个 整数 值 
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如 果 结 果 为 真 (i< 10)， 将 下 列 值 加 到 程序 计数 器 
注意 : FFF5 = - 11 (十 进 制 数 ) 


return 否则 ， 返 回 


四 8-15 为 Simple. class 加 注解 的 字 节 码 


如 果 有 Java 编程 人 员 不 明白 解释 程序 是 如 何 知 道 哪个 源 代码 行 引 起 了 程序 出 错 ， 可 以 研究 一 下 图 
8-14 中 从 地 址 108h 开始 的 二 进 制 类 文件 ， 就 不 难得 到 答案 。 这 个 地 址 也 就 是 源 程序 中 行 数 表 (line 
number table) 的 开始 处 ， 行 数 表 描 述 的 是 源 程序 中 某 个 的 特定 行 与 程序 计数 器 值 的 对 应 关系 。 在 地 址 
106h 开始 的 两 个 字 节 通 知 JVM 在 接 下 行 数 表 中 有 7 个 人 口 条 目 。 通过 补充 细节 ， 我们 可 以 构建 一 个 
程序 计数 器 值 和 源 程序 行 的 相互 对 照 表 (也 称 为 交叉 引用 ，cross-reference)， 如 图 8-16 所 示 。 





Public class Simple { 
public static void main (String[] args) { 
int i =0; 
double j] = 0; 
while (i< { 
i ee 
村 玉 
六 // while 
} // main() 
} // Simple() 
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8-16 ”有 关 simple. class 的 程序 计数 器 和 源 程序 行 的 相互 对 照 表 
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例如 ， 当 PC=9 时 ， 程 序 会 发 生 崩 省， 出 错 的 源 程 序 行 应 该 是 第 6 行 。 当 PC 大 于 或 等 于 0Bh 且 
小 于 0Fh 时 ， 将 开始 解释 由 源 代码 的 第 7 行 所 生成 的 字 节 码 。 

因为 JVM 在 装载 和 执行 字 节 码 时 要 做 很 多 工作 ， 所 以 JVM 的 性 能 不 可 能 与 编译 程序 语言 的 性 能 
相 匹 配 。 即 使 是 采用 即时 〈Just-In-Time，JIT) 编译 器 的 加 速 软件 ， 这 种 情况 也 是 如 此 。 然 而 ， 这 种 
权衡 带 来 的 好 处 是 ， 类 文件 可 以 在 某 个 计算 机 平台 下 创建 和 保存 ， 而 在 另 一 个 完全 不 同 的 计算 机 平台 
上 执行 。 例 如 ， 我 们 可 以 在 一 台 Alpha RISC 服务 器 上 编写 和 编译 一 个 Java 程序 ， 这 个 程序 将 能 够 运 
行 在 那些 下 载 这 种 类 字 节 码 的 CISC 结构 的 奔腾 系列 客户 机 上 。 这 种 “编写 一 次 ， 到 处 运行 ”的 范式 对 
于 使 用 不 同 结构 的 系统 和 地 理 上 分 散 的 系统 的 企业 来 说 是 非常 方便 的 。Java 小 程序 (applet， 指 一 些 运 
行 在 浏览 器 中 的 字 节 码 ) 对 于 基于 Web 的 交易 和 电子 商务 活动 来 说 是 必需 的 。 基 本 上 ， 在 Java 小 程序 
的 支持 下 ， 用 户 所 要 做 的 一 切 就 是 合理 地 运行 当前 的 浏览 器 软件 。 由 于 Java 的 可 移植 性 和 易 用 性 特 
点 ， 使 得 Java 语言 及 其 虚拟 机 环境 非常 适合 于 作为 一 个 理想 的 中 间 件 平台 。 


8.6 数据 库 软 件 


显然 ， 企 业 最 有 价值 的 资产 不 是 办 工 室 或 工厂 ， 而 是 企业 的 数据 资料 。 不 管 企 业 的 性 质 如 何 : 私 
人 企业 ， 教 育 机 构 ， 或 者 是 政府 部 门 ， 有 关 企业 的 过 去 历史 和 现状 的 明确 记录 都 会 在 它 的 数据 资料 中 
留 下 烙印 。 如 果 这 些 数据 和 企业 的 状态 不 一 致 ， 或 者 数据 本 身 之 间 不 一 致 ， 那 么 这 些 数据 的 可 用 性 就 
会 受到 质疑 ， 并 且 肯 定 会 产生 麻烦 。 

支撑 一 个 企业 的 任何 计算 机 系统 都 是 一 些 相 关 的 应 用 程序 的 技术 平台 。 这 些 应 用 程序 会 不 断 进 行 
数据 的 更 新 工作 ， 以 保持 企业 的 数据 和 企业 的 状态 变化 相 一 致 。 人 们 通常 将 这 些 相关 的 应 用 程序 组 称 
为 应 用 程序 系统 (application system) ， 因 为 这 些 程序 需要 像 一 个 集体 一 样 协同 工作 : 很 少 有 程序 的 独 
自 工作 会 非常 有 效 。 应 用 程序 系统 的 各 个 组 件 会 共享 同一 组 数据 ， 通 常 ( 但 不 是 必须 ) 也 会 共享 相同 
的 计算 环境 。 现 在 ， 应 用 程序 系统 使 用 许多 不 同 工 作 平台 ; 桌面 微型 机 、 文 件 服务 器 和 大 型 计算 机 系 
统 。 随 着 基于 Web 的 相互 合作 的 计算 方式 的 普及 ， 人 们 有 了 时 根本 不 知道 或 者 不 用 关心 他 们 的 应 用 程序 
是 在 哪里 运行 的 。 虽 然 从 数据 管理 科学 的 角度 来 说 ， 每 种 计算 机 平台 都 有 自己 的 优势 和 面临 的 挑战 ， 
但 是 数据 库 管 理 软件 的 基本 观念 30 多 年 来 一 直 没 有 改变 过 。 

早期 应 用 程序 系统 采用 磁带 或 打 孔 卡片 来 记录 数据 。 由 于 具有 顺序 的 特点 ， 磁 带 和 打 孔 卡片 上 的 
数据 更 新 工作 必须 作为 一 个 组 来 运行 ， 或 者 说 是 批 处 理 方 式 ， 以 提高 数据 处 理 效率 。 因 为 磁盘 上 的 任 
何 数 据 单元 都 能 够 直接 进行 访问 ， 所 以 使 用 磁盘 的 计算 机 系统 结构 已 经 不 再 强制 使 用 依赖 平面 文件 
(flat file) 的 批 处 理 更 新 方式 。 然 而 ， 旧 的 习惯 一 时 很 难 打 破 ， 而 且 大 量程 序 的 重 写 工 作 需 要 花费 很 高 
的 代价 。 因 此 ， 平 面 文件 的 处 理 方式 在 大 多 数 读 卡 器 都 变 成 博物 馆 的 陈列 品 而 不 再 使 用 后 还 持续 了 很 
多 年 。 

在 平面 文件 中 ， 每 个 应 用 程序 都 可 以 自由 定义 自己 所 需 的 数据 对 象 。 正 因为 这 样 ， 人 们 对 于 应 
用 程序 系统 很 难 有 一 个 统一 的 观点 。 例 如 ， 假 如 有 一 个 应 收 款 账户 管理 系统 ， 它 是 一 个 用 来 记录 公 
司 债务 人 的 名 称 、 债 务 数目 和 负债 时 间 的 应 用 程序 系统 。 这 个 程序 系统 按 月 份 自动 生成 发 票 ， 可 以 
将 每 月 的 交易 事项 发 布 到 一 个 名 为 CUST owE 的 6 位 数字 域 (或 数据 元 素 )。 现 在 ， 按 月 核对 账目 的 
人 员 可 能 恰好 命名 这 个 域 为 cusT BAL， 并 且 希 望 这 个 域 的 宽度 为 5 位 数字 。 这 里 ， 几 乎 可 以 肯定 
有 些 东 西 出 现 了 重 登 ， 将 会 委 失 某 些 信息 或 者 产生 混乱 。 也 许 在 某 个 月 的 某 个 时 间 ， 出 现 了 儿 千 美元 
的 账目 “未 予 说 明 (unaccounted for)” 的 事情 。 最 后 ， 我 们 对 该 程序 进行 排 错 调试 时 却 发 现 CUST_ OWE 
和 cUST ”BAL 是 同一 个 数据 元 素 ， 而 上 面 的 问题 是 由 于 数据 截取 或 某 个 域 的 溢出 条 件 所 引起 的 。 

数据 库 管理 系统 (database management systems，DBMS) 的 发 明 就 是 为 了 防止 出 现 上 述 的 困境 。 
数据 库 管理 系统 对 于 基于 文件 的 应 用 程序 系统 强制 实行 顺序 和 一 致 性 。 使 用 数据 库 系 统 ， 编 程 人 员 不 
青 能 够 按 自己 喜欢 的 方式 来 任意 描述 和 访问 某 个 数据 元 素 。 在 数据 库 管 理 系 统 中 只 有 一 种 数据 元 素 的 
定义 方式 。 即 系统 的 数据 库 模 式 (database schema) 。 在 某 些 计算 机 系统 上 ， 程 序 员 看 待 数据 库 的 观点 
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与 计算 机 系统 看 待 数据 库 的 观点 之 间 存 在 着 很 大 差别 。 前 者 称 为 数据 库 逻 辑 模式 (logical schema) ， 后 
者 称 为 数据 库 物 理 模 式 (physical schema) 。 数 据 库 管 理 系统 将 数据 库 的 逻辑 模式 和 物理 模式 整合 成 一 
体 。 应 用 程序 在 数据 库 管 理 系统 和 操作 系统 的 控制 下 ， 运 用 数据 库 管理 系统 所 呈现 的 逻辑 模式 来 读 取 
和 更 新 位 于 物理 模式 中 的 数据 。 图 8-17 描述 了 这 种 关系 。 





图 8-17 数据 库 管理 系统 与 其 他 系统 组 件 之 间 的 相互 关系 


我 们 把 由 某 个 数据 库 模式 所 定义 的 单个 数据 元 素 组 织 称 为 记录 (records) 的 逻辑 结构 ， 将 记录 组 
合 在 一 起 就 成 为 文件 。 相 关 文 件 的 集合 即 构成 数据 库 。 

数据 库 设计 人 员 充 分 考虑 到 应 用 程序 的 需求 ， 以 及 创建 逻辑 模式 和 物理 模式 后 的 性 能 。 通 常 的 设 
计 目 标 是 既 要 将 宛 余 性 和 浪费 的 空间 减 至 最 小 ， 同 时 又 要 保持 一 个 满足 需求 的 性 能 水 平 。 这 种 性 能 水 
平 通常 按照 应 用 程序 的 反应 时 间 来 测评 。 例 如 ， 银 行 系统 不 会 将 客户 名 字 和 地 址 放 到 数据 库 中 的 每 个 
已 经 取消 了 的 支票 记录 上 。 该 信息 仅 会 保存 在 一 个 账户 主 文件 中 ， 这 个 账户 主 文件 使 用 账户 号 作为 关 
键 字 域 (key field) 。 然 后 ， 每 个 被 取消 的 支票 只 会 出 现 账号 以 及 和 支票 本 身 有 关 的 信息 。 

数据 库 管理 系统 对 于 如 何 从 物理 上 组 织 数据 变化 很 大 。 实 际 上 ， 每 个 数据 库 供应 商都 开发 了 自己 
专 有 的 管理 和 文件 索引 的 方法 。 大 多 数 数据 库 系 统 都 使 用 不 同 的 B 十 树 型 数据 结构 (参见 附录 A 的 详 
细 说 明 )。 数 据 库 管理 系统 通常 会 独立 于 操作 系统 管理 磁盘 存储 器 。 通 过 从 磁盘 管理 过 程 中 除去 操作 系 
统 层 ， 数 据 库 系统 能 够 按照 数据 库 的 模式 和 索引 设计 来 优化 磁盘 系统 的 读 写 操作 。 

在 第 7 章 中 ， 我 们 学 习 了 磁盘 文件 的 组 织 结构 。 大 家 知道 大 多 数 磁盘 系统 都 是 以 成 块 的 方式 从 磁 
盘 中 读 取 数据 ， 最 小 的 寻 址 单元 为 一 个 扇 区 。 大 多 数 大 型 系统 的 一 次 读 操作 可 以 读 取 一 个 完整 磁道 的 
数据 。 当 索引 结构 变 得 很 深 时 ， 我 们 需要 执行 多 次 读 操作 才能 使 遍历 索引 树 的 可 能 性 大 大 增加 。 所 以 ， 
现在 的 关键 问题 是 如 何 组 织 这 个 索引 树 来 尽 可 能 降低 磁盘 IO 操作 的 频率 。 其 中 一 种 方案 是 创建 非常 
大 的 内 部 结 点 以 便 使 每 个 节点 上 可 以 覆盖 更 多 的 记录 值 。 显 然 ， 这 种 大 节点 可 以 减少 索引 树 的 每 一 层 
的 结 点 数 ， 而 且 有 可 能 通过 一 次 读 操作 即 可 访问 一 个 完整 的 索引 树 层 。 另 外 一 种 方案 是 让 内 部 结 点 的 
规模 变 小 以 便 在 一 次 读 操 作 中 可 以 读 取 索 引 树 的 更 多 层 。 到 底 哪 种 是 比较 好 的 方式 呢 ? 这 个 问题 的 答 
案 与 数据 库 所 运行 的 特定 计算 机 系统 有 关 。 要 得 到 一 个 最 佳 的 答案 甚至 可 能 取决 于 数据 本 身 。 例 如 ， 
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如 果 数 据 的 关键 字 较 稀疏 〈sparse) ， 也 就 是 说 可 能 会 有 很 多 没有 使 用 的 关键 字 的 值 ， 这 种 情况 下 我 们 
也 许 会 选择 某 种 特定 的 索引 组 织 方案 。 但 是 对 于 密集 型 的 索引 结构 ， 可 能 会 选择 另外 一 种 方案 。 不 管 
数据 库 的 实现 方式 如 何 ， 数 据 库 的 调整 对 于 理解 数据 库 的 管理 软件 、 系 统 的 存储 结构 以 及 系统 管理 的 
数据 分 布 的 细节 来 说 ， 都 是 一 项 非常 重要 的 任务 。 

数据 库 文件 通常 有 多 个 索引 。 例 如 ， 假 如 有 一 个 的 客户 数据 库 ， 使 用 客户 账号 和 客户 姓名 来 查找 
记录 不 失 为 一 个 好 办 法 。 当 然 ， 每 个 索引 都 会 增加 系统 在 空间 〈 用 于 存放 索引 ) 和 时 间 〈 因 为 当 增加 
或 删除 记录 时 ， 所 有 索引 都 必须 立即 更 新 ) 方面 的 开销 。 数 据 库 系统 设计 人 员 所 面临 的 一 个 主要 挑战 
是 ， 既 要 确保 有 足够 的 索引 来 实现 大 多 数 情况 下 的 快速 检索 ， 而 且 又 不 会 在 系统 的 管理 事务 上 增加 大 
重 的 负担 。 

数据 库 管 理 系统 的 目标 是 提供 对 大 量 数据 及 时 和 方便 的 访问 ， 但 是 还 要 设法 确保 数据 库 的 完整 性 。 
这 意味 着 数据 库 管理 系统 还 必须 允许 用 户 自己 定义 规则 和 管理 规则 ， 或 者 说 将 一 些 限制 (constraints) 
加 到 某 些 关 键 的 数据 元 素 上 。 有 时 ， 这 些 限制 只 是 一 些 非常 简单 的 规则 ， 例 如 ，“ 客 户 号 不 能 为 空 ”。 
当然 ， 还 有 许多 更 复杂 的 规则 ， 例 如 规定 哪 类 用 户 可 以 看 到 哪 类 数据 元 素 ， 以 及 包含 相关 数据 元 素 的 
文件 如 何 更 新 等 等 。 对 于 任何 数据 库 管理 系统 的 实用 性 来 说 ， 有 关系 统 安全 性 的 定义 和 措施 ， 以 及 数 
据 完 整 性 的 限制 都 是 十 分 关键 的 。 

数据 库 管理 系统 的 另外 一 个 核心 组 件 是 数据 库 的 事务 管理 器 。 事 务 管理 器 (transaction manager) 
负责 控制 更 新 数据 对 象 ， 以 确保 数据 库 总 是 处 于 前 后 一 致 的 状态 。 从 形式 上 来 说 ， 事 务 管理 器 控制 数 
据 状 态 的 变化 ， 这 样 每 个 处 理事 务 都 具有 如 下 特性 : 

。 原 子 性 〈atomicity) 一 一 所 有 相关 的 更 新 都 在 事务 的 范围 内 发 生 或 者 根本 不 发 生 更 新 。 

。 一 致 性 (consistency) 一 一 所 有 更 新 都 要 满足 对 全 部 数据 元 素 设置 的 各 种 限制 。 

。 隔 离 性 (isolation) 一 一 没有 事务 可 以 干涉 其 他 事务 的 活动 和 更 新 。 

。 持 久 性 (durability) 一 一 成 功 的 事务 要 尽 可 能 快 地 写 人 “持久 性 ”介质 上 例如 磁盘 )。 

这 就 是 大 家 所 熟知 的 有 关 事 务 管理 的 ACID 特性 (ACID properties) 的 4 项 基本 内 容 。 通 过 下 面 
的 例子 ， 我 们 可 以 很 容易 理解 这 种 ACID 特性 的 重要 性 。 

假设 你 已 经 支付 了 信用 卡 的 月 账单 ， 并 立即 将 账单 邮寄 出 去 。 现 在 ， 你 到 了 附近 的 一 个 商店 ， 用 
信用 卡 进 行 另 一 次 购物 。 假 如 恰好 在 售货员 用 读 卡 机 刷卡 时 ， 银 行 会 计 也 正在 将 你 的 月 付款 输入 到 银 
行 的 数据 库 。 图 8-18 给 出 了 一 台中 央 计算 机 系统 处 理 这 些 事务 的 一 种 方式 。 


信用 卡 账单 
时 间 





图 8-18 一 种 假想 事务 处 理 的 方式 
图 中 ， 银 行 会 计 在 售货员 完成 刷卡 之 前 完成 了 数据 更 新 ， 结 果 留 下 一 个 300 美元 的 未 付 账单 。 当 
然 ， 也 有 可 能 容易 发 生 图 8-19 所 示 的 处 理事 务 。 这 里 ， 售 货 员 先 完成 数据 的 更 新 ， 因 此 信用 卡 账户 上 
的 结余 为 0. 00 美元 ， 也 就 是 说 你 刚刚 得 到 了 免费 商品 。 
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图 8-19 另 一 种 假想 事务 处 理 的 方式 

虽然 免费 得 到 商品 可 能 会 让 你 感到 高 兴 ， 但 是 同样 可 能 出 现 的 事情 是 要 支付 账单 两 次 。 当 然 ， 你 
会 和 银行 会 计 争论 ， 直 到 出 错 的 记录 被 更 正 过 来 。 刚 才 我 们 描述 的 这 种 情形 被 称 为 竞争 状态 ; (race 
condition)， 因 为 数据 库 最 终 的 状态 并 不 取决 于 数据 更 新 的 正确 性 ， 而 是 取决 于 最 后 完成 的 处 理事 务 。 

事务 管理 器 通过 强制 实施 的 处 理事 务 的 原子 性 和 隔离 性 来 防止 这 种 竞争 状态 的 发 生 。 为 此 ， 人 们 
会 在 数据 记录 上 安置 各 种 不 同类 型 的 锁 。 如 在 8-18 的 例子 中 ， 银 行 会 计 将 会 在 信用 卡 记录 上 一 个 “ 专 
用 ” 锁 。 这 把 锁 只 有 在 完成 将 更 新 过 的 数据 写 回 磁盘 后 才 会 打开 。 当 银行 会 计 的 处 理事 务 正在 运行 时 ， 
售货员 会 得 到 一 个 系统 正 忙 的 信息 。 当 银行 数据 更 新 处 理 完成 后 ， 事 务 管理 器 就 会 打开 银行 会 计 的 这 
把 锁 ， 并且 立即 为 售货员 上 另 一 把 锁 。 正 确 的 事务 处 理 如 图 8-20 所 示 。 
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图 8-20 一 个 孤立 的 原子 处 理事 务 


这 种 解决 方案 也 存在 一 些 风险 。 如 果 在 任意 时 刻 一 个 复杂 系统 中 的 某 个 实体 被 锁 住 的 话 ， 就 有 潜 
在 的 死 锁 危险 。 当 然 ， 各 种 数据 库 系 统 都 能 够 非常 巧妙 地 管理 系统 中 的 各 种 锁 以 降低 发 生死 锁 的 风险 ， 
但 是 每 种 预防 或 检测 死 锁 的 措施 都 会 给 系统 带 来 更 多 的 管理 成 本 。 如 果 管 理 锁 的 任务 太 多 的 话 ， 事 务 
处 理 的 性 能 就 会 受到 影响 。 一 般 来 说 ， 死 锁 的 预防 和 检测 并 不 是 数据 库 性 能 考虑 中 的 最 重要 因素 。 死 
锁 的 情形 很 少 发 生 ， 而 性 能 却 是 每 个 事务 处 理 中 的 一 个 关键 因素 。 

另外 一 个 需要 考虑 的 性 能 问题 是 数据 日 志 。 在 更 新 记录 的 过 程 中 〈 包 括 记 录 删 除 的 过 程 )， 数 据 库 
事务 管理 器 要 把 事务 的 图 像 写 入 日 志文 件 〈log file， 或 称 为 运行 记录 文件 )。 因 此 ， 每 次 数据 更 新 都 需 
要 至 少 两 次 写 人 : 一 次 写 原始 文件 ， 另 一 次 写 日 志文 件 。 日 志文 件 非常 重要 。 如 果 由 于 出 现 一 个 错误 
而 必须 中 止 某 个 事务 时 ， 日 志文 件 可 以 帮助 系统 保持 处 理事 务 的 完整 性 。 例 如 ， 如 果 数 据 库 管理 系统 
在 实际 更 新 发 生前 获得 将 要 更 新 的 记录 的 一 个 图 像 ， 那 么 这 个 老 的 图 像 能够 被 快速 地 写 回 到 磁盘 系统 ， 
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从 而 擦 除 掉 以 后 对 该 记录 的 所 有 更 新 。 在 某 些 数 据 库 系统 中 ， 更 新 “前 ”和 更 新 “后 ”的 记录 图 像 都 
会 被 捕捉 记录 ， 这 样 使 得 错误 恢复 会 变 得 相对 容易 一 些 。 

作为 检查 跟踪 (audit trail， 也 称 为 审计 跟踪 ) ， 数 据 库 日 志 也 是 非常 有 用 的 。 数 据 库 日 志 可 以 显示 
谁 在 什么 时 候 更 新 了 哪个 文件 以 及 哪个 数据 元 素 被 改变 了 。 一 些 细心 的 系统 管理 员 常 常会 把 日 志文 件 
放 在 磁带 库 中 保存 几 年 时 间 。 

对 于 数据 备份 和 数据 恢复 来 说 ， 日 志文 件 是 非常 重要 的 工具 。 有 些 数 据 库 实在 是 太 大 了 ， 以 至 于 
不 可 能 每 天 都 用 磁带 或 光盘 来 进行 备份 ， 因 为 需要 花费 太 多 时 间 。 而 实际 上 的 做 法 是 ， 数 据 库 文件 的 
全 备份 工作 一 周 只 需 做 一 至 两 次 ， 但 是 日 志文 件 却 是 每 天 都 必须 保存 。 如 果 在 这 些 全 备份 之 间 的 某 个 
时 刻 发 生 了 任何 灾难 性 事件 ， 那 么 可 以 利用 记录 该 时 间 段 的 事务 的 日 志文 件 进行 向 前 恢复 〈forward 
recovery)， 重 建 每 日 的 处 理事 务 就 好 像 是 由 早先 那些 用 户 重新 输入 到 数据 库 一 样 。 

我 们 刚刚 讨论 过 了 有 关 数 据 库 访 问 的 控制 问题 ， 即 安全 、 索 引 管理 和 锁 管理 ， 这 些 事 务 消耗 了 大 
量 的 系统 资源 。 事 实 上 ， 对 于 早期 的 系统 来 说 ， 这 个 管理 费用 实在 是 太 大 了 以 至 于 有 些 人 怀疑 是 否 要 
继续 使 用 这 种 基于 文件 的 数据 库 系统 ， 原 因 是 他 们 的 计算 机 主机 系统 难以 处 理 数 据 库 管理 的 重负 。 即 
使 是 采用 当今 功能 非常 强大 的 计算 机 系统 ， 如 果 我 们 不 对 数据 库 系统 进行 适时 的 调整 和 恰当 的 维护 ， 
系统 的 吞吐 量 也 会 受到 很 大 影响 。 系 统 操作 人 员 和 数据 库 分 析 员 都 必须 精心 地 监控 处 理 大 量 事务 的 环 
境 ， 努 力 使 数据 库 管 理 系统 保持 最 佳 的 工作 性 能 。 


8.7 事务 管理 器 


一 种 改善 数据 库 性 能 的 方法 是 简单 地 让 数据 库 少 做 些 工 作 ， 而 是 把 数据 库 的 一 些 功能 分 离 出 来 转 
移 到 其 他 系统 组 件 上 。 事 务 管理 就 是 从 一 个 数据 库 管理 系统 的 核心 数据 管理 功能 中 分 离 出 来 的 一 个 数 
据 库 组 件 。 独 立 的 事务 管理 器 通常 也 组 合 了 负载 平衡 和 其 他 一 些 不 适合 包含 在 数据 库 核心 软件 中 的 最 
优化 的 特征 ， 从 而 改善 了 整个 系统 的 效率 。 当 商业 交易 跨越 两 个 或 更 多 分 离 的 数据 库 时 ， 事 务 管理 器 
会 显得 特别 有 用 。 没 有 一 个 参与 事务 处 理 的 数据 库 能 够 为 它们 对 等 的 数据 库 的 完整 性 负责 ， 但 利用 一 
个 外 部 事务 管理 器 就 能 保持 所 有 这 些 数据 库 同 步 。 

其 中 一 个 最 早 和 最 成 功 的 事务 管理 器 是 IBM 的 顾客 信息 和 控制 系统 〈Customer Information and 
Control System，CICS) 。 自 从 1968 年 推 向 市 场 后 ，CICS30 年 来 一 直 表 现 良好 。CICS 之 所 以 如 此 引 人 
注目 ， 是 因为 它 是 第 一 个 将 事务 处 理 “TP)、 数 据 库 管理 和 通信 管理 整合 到 一 个 单一 的 应 用 程序 套件 
中 的 系统 。 然 而 ，CICS 的 各 个 组 件 都 是 非常 松散 地 耦合 在 一 起 的 《至今 仍然 如 此 )， 这 样 可 以 把 每 个 
组 件 都 当 作 一 个 单独 的 实体 来 调整 和 管理 。CICS 的 通信 管理 组 件 控制 各 个 终端 和 主机 系统 之 间 交 互 活 
动 ， 我 们 称 为 会 话 〈conversation) 。 由 于 没有 了 协议 管理 的 负担 ， 数 据 库 和 应 用 程序 能 够 更 加 有 效 地 
完成 自己 的 工作 。 

CICS 是 第 一 个 在 客户 服务 器 环境 中 采用 远程 过 程 调用 的 应 用 程序 系统 。 现 代 版 本 的 CICS 能 够 管 
理 上 千 上 万 个 因特网 用 户 和 大 型 主机 之 间 的 事务 处 理 。 直 到 现在 ，CICS 还 是 非常 类 似 20 世纪 60 年 代 
开始 时 的 那 种 体系 结构 ， 实 际 上 CICS 的 体系 结构 已 经 成 为 此 后 发 明 的 所 有 事务 处 理 系统 的 范式 。 现 
代 CICS 结构 示意 图 如 图 8-21 所 示 。 

从 图 中 可 以 看 出 ， 称 为 事务 处 理 监 视 器 (transaction processing monitor，TP monitor) 的 程序 是 
这 个 系统 中 的 关键 组 件 。 它 从 远程 通信 管理 器 接收 输入 ， 并 通过 保存 哪些 用 户 被 授权 哪些 事务 的 清单 
的 数据 文件 来 对 系统 中 的 事务 进行 鉴别 监视 。 有 时 ， 这 种 安全 信息 包括 某 些 特定 的 信息 ， 例 如 定义 在 
什么 地 方 可 以 运行 某 些 特定 的 事务 (如 在 内 部 网 还 是 互连网 ，intranet versus internet)。 一 旦 这 个 TP 
监控 器 鉴别 了 这 个 事务 ， 它 就 开始 执行 用 户 所 请 求 的 应 用 程序 。 当 应 用 程序 需要 数据 时 ，TP 监控 器 向 
数据 库 管 理 软件 发 送 一 个 请 求 。 事 务 处 理 监视 器 在 完成 所 有 这 些 工 作 ， 同 时 在 多 个 并 发 执行 的 应 用 程 
序 进程 中 的 保持 每 个 处 理事 务 的 原子 性 和 隔离 性 。 

也 许 读者 已 经 想到 ， 要 求 所 有 的 这 些 TP 软件 的 各 个 组 件 都 必须 驻 留 在 同一 台 主 机 计算 机 上 是 毫 
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= 应 用 程序 






远程 通信 管理 器 
端口 监听 后 台 程序 





图 8-21 CICS 的 体系 结构 


无 道理 的 。 的 确 ， 我 们 没有 理由 要 把 这 些 组 件 都 放 在 一 起 。 一 些 分 布 式 的 体系 结构 专门 利用 一 个 小 组 
服务 器 来 运行 TP 监控 器 。 运 行 监视 器 的 系统 和 包含 数据 库 管理 软件 的 系统 从 物理 结构 上 来 说 是 不 同 
的 。 事 实 止 ， 也 没有 必要 让 运行 TP 监控 器 的 系统 和 运行 数据 库 管理 软件 的 系统 是 同一 类 的 系统 。 例 
如 ， 我 们 可 以 使 用 Sun 公司 的 Unix RISC 结构 的 系统 来 进行 通信 管理 ， 而 使 用 Unisys 公司 的 ES/7000 
系统 在 Windows Dataceniter 操作 系统 环境 下 运行 数据 库 软 件 。 可 以 通过 桌面 计算 机 或 移动 式 个 人 计算 
机 来 输入 各 种 处 理事 务 。 这 种 配置 被 认为 是 一 个 3 层 的 体系 结构 (3-tiered architecture) ， 每 个 平台 代 
表 一 个 层次 。 更 通常 情况 是 一 个 n 层 (n-tiered) 的 体系 结构 ， 或 者 是 多 层 体系 结 梅 〈mnulti-tiered ar- 
chitecture) 。 随 着 Web 计算 和 电子 商务 的 出 现 ，n 层 TP 体系 结构 变 得 越 来 越 流 行 。 许 多 系统 供应 商 ， 
包括 Microsoft、Netscape、Sybase、SAP AG 和 IBM 的 CICS， 都 已 经 能 够 成 功 支持 各 种 不 同 的 nH 层 事 
务 处 理 系统 。 当 然 ， 我 们 不 可 能 对 某 个 特定 的 企业 说 其 中 哪个 会 “更 好 ”一 些 。 这 里 的 每 种 产品 都 有 
自己 的 优 缺点 。 在 决定 哪 种 体系 结构 最 适合 某 个 特定 的 环境 之 前 ， 如 果 在 设计 一 个 TP 系统 时 能 够 同 
时 考虑 系统 的 成 本 和 所 有 可 靠 性 因素 应 该 是 一 种 比较 谨慎 的 做 法 。 


本 章 小 结 


本 章 描述 了 计算 机 硬件 与 软件 之 间 的 相互 关系 。 计 算 机 软件 和 硬件 结合 起 来 ， 才 能 构成 一 个 具有 特定 
功能 和 高 效率 的 计算 机 系统 。 系 统 软件 ， 包 括 操作 系统 和 应 用 软件 ， 是 连接 计算 机 用 户 和 计算 机 硬件 的 一 
个 接口 。 系 统 软 件 让 我 们 能 够 对 低层 计算 机 体系 结构 进行 抽象 处 理 。 这 样 就 为 用 户 创造 一 个 工作 环境 ， 这 
里 用 户主 要 考虑 的 是 问题 的 解决 方案 ， 而 不 是 系统 操作 。 

在 操作 系统 设计 中 ， 计 算 机 硬件 与 软件 之 间 的 相互 作用 和 深度 依赖 关系 是 十 分 显然 的 。 从 历史 发 展 来 
看 ， 操 作 系 统 起 源 于 一 种 “开放 式 计 算 工作 站 (open shop)” 的 方式 ,然后 转变 为 操作 员 控 制 的 批 处 理 方 
式 ， 进 而 发 展 到 支持 交互 式 的 多 道 程序 处 理 和 分 布 式 计算 。 现 代 操 作 系 统 提供 了 一 个 用 户 接口 和 各 种 各 样 
的 服务 ， 包 括 内 存 管理 、 进 程 管理 、 通 用 资源 管理 、 调 度 和 保护 等 。 
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有 关 操 作 系 统 概念 的 知识 对 于 每 位 计算 机 专业 人 员 来 说 都 是 至 关 重 要 的 。 事实 上 ， 所 有 系统 活动 都 与 
操作 系统 的 服务 紧密 相关 。 如 果 操 作 系统 出 了 问题 ， 那 么 整个 系统 会 出 现 问 题 。 然 而 ， 我 们 也 应 该 清楚 意 
识 到 ， 并 不 是 所 有 的 计算 机 都 有 ， 或 者 需要 有 一 个 操作 系统 。 其 人 式 系统 就 是 这 样 的 情形 。 在 汽车 或 微波 
中 的 计算 机 要 执行 的 任务 都 非常 简单 ， 所 以 也 就 没有 必要 使 用 操作 系统 。 但 是 ， 对 于 不 只 是 完成 运行 单一 
程序 的 简单 任务 的 计算 机 系统 来 说 ， 操 作 系统 是 必需 的 。 利 用 操作 系统 ， 人们 可 以 更 加 有 效 和 方便 地 使 用 
计算 机 。 操 作 系统 是 一 种 大 型 软件 系统 。 一 般 来 说 ， 研 究 操 作 系 统 对 于 系统 软件 开发 是 十 分 有 价值 的 。 巾 
于 各 种 各 样 的 理由 ， 在 这 里 我 们 衷心 地 希望 大 家 能 够 对 计算 机 操作 系统 的 设计 和 开发 进行 更 加 深入 的 探索 。 

利用 汇编 程序 和 编译 器 ， 人 们 可 以 将 人 类 可 能 够 阅读 的 计算 机 语言 转换 成 适合 于 在 机 器 上 执行 的 二 进 
制 形式 。 计 算 机 的 解释 程序 也 能 生成 二 进 制 代码 ， 但 是 通常 这 种 代码 没有 由 汇编 程序 所 生成 的 二 进 制 代码 
的 速度 快 和 效率 高 。 

Java 编程 语言 生成 的 代码 可 用 一 个 位 于 字 节 码 和 操作 系统 之 间 的 虚拟 机 来 解释 。Java 代码 运行 的 速度 
要 比 二 进 制程 序 慢 得 多 ,但 是 Java 代码 可 以 在 各 种 不 同 的 计算 机 平台 之 间 很 方便 地 进行 移植 。 

数据 库 系统 软件 通常 通过 事务 处 理 系统 来 控制 对 数据 文件 的 访问 。 数 据 库 系统 的 ACID 特性 能 够 确保 
数据 库 中 的 数据 总 是 保持 一 致 的 状态 。 

构建 大 型 的 、 可 靠 的 系统 是 现在 计算 机 科学 所 面临 的 一 个 主要 挑战 。 至 此 ,读者 已 经 知道 了 计算 机 系 
统 远 不 是 只 有 硬件 和 程序 这 样 简单 。 企 业 级 计算 机 系统 由 一 些 独 立 的 处 理 单元 的 集合 构成 ， 这 里 的 每 个 处 
理 单元 都 有 自己 的 功能 。 如 果 仅 从 用 户 的 角度 来 看 ， 这 些 独 立 的 处 理 单元 中 的 任何 一 个 出 现 失 效 或 者 性 能 
低下 ， 都 会 对 整个 系统 的 运行 带 来 破坏 性 的 后 果 。 在 今后 的 工作 和 学 习 中 ， 读 者 还 将 会 详细 学 习 到 本 章 的 
许多 问题 。 作 为 一 个 系统 管理 员 和 系统 编程 用 户 ， 必 须 深 刻 理解 和 掌握 这 些 相 关 思 想 。 这 些 思 想 将 会 具体 
地 应 用 于 各 种 特定 的 操作 环境 中 。 

无 论 人 们 编写 的 程序 如 何 智 能 ， 都 难以 弥补 由 于 运行 程序 的 系统 组 件 的 拙劣 性 能 所 带 来 的 各 种 问题 。 
在 第 10 章 中 我 们 将 进行 深入 研究 ， 更 加 详细 地 探讨 有 关系 统 性 能 方面 的 各 种 问题 。 


深入 阅读 


系统 软件 领域 中 的 最 令 人 感 兴趣 的 阅读 材料 是 产品 供应 商 所 提供 的 附带 资料 。 事 实 上 ， 人 们 可 以 经 常 
通过 供应 商 提供 的 文献 的 质量 和 关注 度 来 评判 其 产品 的 质量 。 浏 览 产品 供应 商 的 网 站 ， 有 时 也 可 以 获得 大 
量 的 有 关 产 品 的 理论 背景 知识 的 第 一 手 资料 。 其 中 两 个 最 好 的 网 站 是 供应 商 IBM 公司 和 Sun 公司 的 网 站 ， 
www. software. ibm. com 和 www, java. sun. com。 如 果 坚 持 不 局 地 搜索 ,无疑 能 够 找到 更 多 内 容 。 

Hall (1994) 关于 客户 -服务 器 的 书籍 是 一 本 极 好 的 客户 -服务 器 理论 的 人 门 读物 。 书 中 介绍 了 当时 大 量 
的 流行 产品 。 

Stallings (2001) 、Tanenbaum (1997)， 以 及 Silberschatz、Galvin 和 Gagne (2001) 的 著作 都 很 好 地 讨 
论 了 本 章 引 入 的 有 关 操 作 系 统 的 基本 概念 和 一 些 高 级 内 容 。Stallings 的 书 中 还 详细 介绍 了 各 种 不 同 的 操作 
系统 以 及 它们 与 实际 机 器 硬件 之 间 的 相互 关系 。 读 者 可 以 在 Brooks (1995) 的 著作 中 找到 有 关 OS/360 开 
发 的 精彩 内 容 。 

Gorsline (1998) 的 有 关 汇 编 语言 的 书籍 较 好 地 介绍 了 汇编 程序 的 工作 原理 。 他 还 讨论 了 链接 和 宏 汇 编 
的 细节 问题 。Aho、Sethi 和 Uliman (1986) 编写 了 一 本 “限定 式 (the definitive)” 编 译 器 的 书 。 因 为 封面 
上 的 播 图 的 缘故 ， 这 本 书 常常 被 称 为 “ 龙 书 (The Dragon Book)”。 因 为 讲述 清楚 和 内 容 全 面 ， 这 本 关于 编 
译 器 理论 的 书籍 近 20 年 来 不 断 再 版 。 每 位 计算 机 科学 家 手头 都 应 该 有 这 样 一 本 书 。 

Sun 公司 的 出 版 物 是 有 关 Java 语言 的 主要 资料 来 源 。Addison-Wesley 出 版 社 出 版 了 一 系列 有 关 详 细 介 
绍 Java 语言 的 书籍 、Lindholm 和 Yellin (1999) 的 “Java 虚 氢 机 规范 (The Java Virtual Machine Specifica- 
tion)” 就 是 这 一 系列 书籍 中 的 一 本 。 它 提供 了 有 关 类 文件 结构 的 一 些 细节 说 明 ， 而 本 书 没有 介绍 这 些 内 
容 。Lindholm 和 Yellin 的 著作 还 包括 Java 字 节 码 指令 和 它们 对 应 的 二 进 制 指令 的 一 个 完整 清单 。 仔 细 研 究 
这 部 分 内 容 无 疑 会 让 读者 对 Java 语言 有 一 种 新 的 视野 。 

虽然 这 些 内 容 稍微 有 些 过 时 ,但 是 Gray 和 Reuter (1993) 的 有 关 事 务 处 理 的 著作 仍 是 一 本 全 面 易 读 的 
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书籍 。 它 为 在 这 个 领域 的 深入 学 习 提 供 了 一 -个 很 好 的 基础 。Silberschatz、Korth 和 Sudarshan (2001) 的 著 
作 全 面 介 绍 了 有 关 数 据 库 的 理论 和 应 用 ， 受 到 了 大 家 的 高 度 关 注 和 好 评 。 
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基本 概念 和 术语 复习 


. 与 现代 操作 系统 相 比 ， 早 期 操作 系统 的 主要 目标 是 什么 ? 

. 常 驻 监控 程序 给 计算 机 的 操作 带 来 了 什么 改进 ? 

. 关于 打印 机 的 输出 ， 假 脱 机 (spool) 一 词 的 由 来 ? 

. 描述 多 道 程序 处 理 系 统 和 分 时 系统 之 间 的 区 别 。 

. 在 硬 实时 计算 机 系统 的 操作 中 最 重要 的 因素 是 什么 ? 

6. 多 处 理 器 系统 是 否 能 够 按照 它们 之 间 的 通信 方式 来 分 类 ? 本 章 中 是 如 何 对 它们 分 类 的 ? 
7、 分 布 式 操 作 系 统 与 网 络 操作 系统 有 什么 区 别 ? 

8. 透明 是 什么 含义 ? 

9. 描述 有 关 操 作 系统 内 核 设 计 中 的 两 种 不 同 的 思想 。 

10. GUI 操作 系统 接口 有 什么 优 缺 点 ? 

11, 长 程 调度 和 短程 调度 有 什么 区 别 ? 

12. 占 先 调度 是 什么 含义 ? 

13. 在 分 时 共享 的 环境 中 什么 样 的 进程 调度 方法 最 有 效 ? 

14. 什么 进程 调度 方法 证 明 是 最 佳 的 ? 

15. 描述 实现 关联 转换 所 涉及 的 步 驴 。 

16. 除了 进程 管理 外 ， 操 作 系 统 的 另外 两 大 功能 是 什么 ? 

17. 什么 是 覆盖 ?为 什么 在 大 型 计算 机 系统 中 不 青 需 要 使 用 覆盖 技术 ? 

18. 操作 系统 和 用 户 程序 对 虚拟 机 有 不 同 的 见解 。 解 释 它 们 之 间 有 什么 区 别 。 
19. 子 系统 和 逻辑 分 区 有 什么 区 别 ? 

20. 列举 服务 器 整合 的 好 处 。 是 否 对 每 个 企业 来 说 服务 器 的 整合 都 是 一 个 好 的 方案 ? 
21. 擅 述 编程 语言 的 分 层 结 构 。 为 什么 三 角形 是 表示 这 种 分 层 结构 的 合适 符号 ? 
22. 绝对 代码 与 可 重新 定位 的 代码 之 间 有 什么 区 别 ? 

23. 链接 编辑 器 有 什么 作用 ? 它 与 动态 链接 库 有 什么 不 同 ? 


Km 一 





24, 
25, 
26. 
27. 


28. 
29. 
30. 
31, 
32. 
33、 
34, 
35, 
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描述 编译 器 的 每 个 阶段 (phase) 的 作用 。 

解释 程序 与 编译 器 有 什么 区 别 。 

在 不 同 的 分 立 硬件 环境 下 具有 可 移植 性 的 Java 编程 语言 有 什么 突出 特点 ? 
汇编 程序 生成 的 机 器 代码 在 链接 编辑 后 是 可 执行 的 。Java 编译 器 会 生成 什么 编码 是 要 在 执行 过 程 中 进 
行 解释 的 ? 

识别 Java 类 文件 的 魔术 数字 是 什么 ? 

逻辑 数据 库 模 式 和 物理 数据 库 模 式 有 何不 同 ? 

在 对 数据 库 建立 索引 时 哪 种 数据 结构 是 最 通用 的 ? 

为 什么 数据 库 重组 是 必要 的 ? 

解释 一 个 数据 库 系统 的 ACID 特性 。 

什么 是 竞争 状态 (race condition)? 

数据 库 日 志 有 哪 两 种 用 途 ? 

事务 管理 器 可 以 提供 什么 服务 ? 


练习 题 


1, 
2, 


使 9. 
10 


11, 
12. 


全 19 


你 认为 如 果 一 个 计算 机 没有 操作 系统 会 受到 什么 限制 ? 用 户 如 何 装载 和 执行 程序 ? 
微 内 核 是 试图 提供 尽 可 能 小 的 内 核 ， 而 将 操作 系统 支持 的 大 部 分 功能 放 到 其 他 模块 中 。 你 认为 内 核 必 须 
提供 的 最 少 的 服务 是 什么 ? 


. 如 果 你 在 为 一 个 实时 系统 书写 代码 ， 那 么 将 会 在 系统 上 加 上 什么 限制 ? 
“ 多 道 程序 处 理 和 多 重 处 理 (multiprocessing) 技术 之 间 有 什么 区 别 ? 多 道 程序 处 理 和 多 线程 技术 之 间 又 


有 什么 区 别 ? 


. 在 什么 情况 下 ， 需 要 将 一 组 进程 和 程序 放 人 运行 在 一 个 大 型 计算 机 上 的 子 系统 中 ? 在 这 个 系统 上 创建 逻 


辑 分 区 有 什么 好 处 ? 


. 在 同一 个 计算 机 上 同时 使 用 子 系统 和 逻辑 分 区 有 什么 好 处 ? 
. 何 时 适合 于 使 用 不 可 重新 定位 的 二 进 制程 序 代 码 ? 为 什么 人 们 偏爱 可 重新 定位 的 代码 ? 
， 如 果 没 有 可 重新 定位 的 程序 代码 。 存 储 器 的 分 页 将 会 变 的 如 何 复 杂 ? 


讨论 动态 链接 的 优 缺 点 。 

. 汇编 程序 需要 克服 哪些 困难 ， 才 能 通过 一 次 通读 源 文件 生成 完整 的 二 进 制 代码 ? 为 一 次 通读 汇编 程序 
编写 的 代码 与 为 二 次 通读 汇编 程序 书写 的 代码 之 间 有 什么 区 别 ? 

为 什么 在 普通 应 用 程序 开发 中 应 该 避免 使 用 汇编 语言 ? 而 在 什么 情况 下 需要 或 者 优先 使 用 汇编 语言 ? 
你 认为 在 什么 样 的 情况 下 ， 使 用 汇编 语言 开发 一 个 应 用 程序 更 加 合适 ? 

. 与 解释 语言 相 比 ， 编 译 语言 有 什么 优点 ? 在 什么 情况 下 你 会 选择 一 种 解释 语言 ? 

. 讨论 下 列 与 编译 器 有 关 的 问题 : 

a) 编译 器 的 哪个 步骤 会 给 出 一 个 语法 错误 ? 

b) 哪个 步骤 会 指出 没有 定义 的 变量 ? 

c) 如 果 想 添加 一 个 整数 到 一 个 字符 串 中 ， 编 译 器 的 哪个 步骤 会 发 出 错误 信息 ? 

. 为 什么 Java 类 的 执行 环境 被 称 为 虚拟 机 ? 这 种 虚拟 机 如 何 与 运行 C 语言 代码 的 真实 机 器 进行 类 比 ? 


: 为 什么 你 会 认为 JVM 的 方法 区 对 所 有 在 患 拟 机 环境 下 运行 的 线程 是 全 局 性 的 ? 
. 我 们 曾经 说 明 过 ， 运 行 于 JVM 每 个 线程 中 一 次 只 能 有 一 个 方法 处 于 活动 状态 。 你 认为 为 什么 会 是 这 种 


情况 ? 

. 访问 局 部 变量 数组 的 一 个 类 的 字 节 码 的 长 度 最 多 有 两 个 字 节 。 其 中 一 个 字 节 用 作 操 作 码 ， 另 外 一 个 字 
节 用 来 指示 在 数组 中 的 偏 移 量 。 在 局 部 变量 的 数组 中 最 多 能 够 保存 多 少 个 变量 ? 如 果 超 过 这 个 数目 ， 
会 发 生 什么 情况 ? 、 

.java 被 称 为 一 种 解释 语言 ， 而 且 Java 也 是 一 种 产生 二 进 制 输 出 流 的 编译 语言 。 试 解释 这 种 语言 是 如 何 
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既 可 以 被 编译 也 可 以 被 解释 的 。 
20. 我 们 曾经 说 明 过 ， 运 行 于 JVM 的 Java 程序 的 性 能 不 可 能 与 一 个 常规 的 编译 语言 相 匹配 。 试 解释 原因 ? 
21. 针对 数据 库 处 理 回答 下 列 问 题 : 
急 a) 什么 是 竞争 状态 (race condition)? 试 举例 说 明 。 
急 b) 如 何 防止 竞争 状态 ? 
会 c) 在 竞争 状态 的 预防 过 程 中 会 有 什么 风险 ? 
22. 多 层 事务 处 理 的 体系 结构 在 哪些 方面 优 于 单 层 结构 ?通常 哪 种 体系 结构 的 代价 会 更 高 ? 
23. 为 了 改善 系统 的 性 能 ， 你 的 公司 决定 通过 几 个 服务 器 来 复制 公司 的 产品 数据 库 。 这 样 不 是 所 有 事务 都 
要 经 过 一 个 单一 的 系统 。 这 里 ， 沉 要 考虑 什么 类 型 的 问题 ? 
24. 我 们 说 过 ， 任 何 时 刻 只 要 有 某 个 系统 资源 被 锁 住 ， 那 么 总 是 会 存在 死 锁 风 险 。 描 述 一 种 死 锁 可 能 发 生 
的 方式 。 
x 25, 研究 各 种 不 同 的 命令 行 (command-line〉 的 接口 界面 (例如 Unix、MS-DOS 和 VMS) 以 及 各 种 不 同 的 
Windows 接口 界面 (例如 任何 Microsoft 的 Windows 产品 、MacOS 和 KDE) 。 
a) 下 面 考 虑 一 些 主要 命令 ， 例 如 列 出 目录 表 、 删 除 文件 、 或 者 改变 目录 。 试 解释 在 你 所 学 过 的 各 种 操 
作 系 统 上 ， 这 些 命令 的 每 条 是 如 何 执行 的 。 
b) 列 出 并 解释 使 用 命令 行 接口 界面 比 使 用 GUI 界面 更 方便 的 一 些 命令 。 同 时 列 出 并 解释 使 用 GUI 界 
面 比 使 用 命令 行 接口 界面 更 方便 的 一 些 命令 。 
c) 你 更 喜欢 哪 种 类 型 接口 ? 为 什么 ? 





品质 永远 都 不 是 偶然 的 ; 品质 是 坚定 的 意志 、 艰 辛 的 努力 、 正 确 的 方向 和 热 练 的 技巧 的 综合 结果 ; 品质 
代表 了 从 许多 的 可 选 物 中 做 出 明智 选择 。 
一 一 William A. Foster 
计算 机 技术 似乎 已 经 达到 了 发 展 的 极限 ， 但 是 我 们 这 样 说 的 时 候 需 要 非常 小 心 ， 因 为 在 未 来 的 5 年 中 这 
些 言 论 听 起 来 可 能 会 有 些 恶 毒 。 
一 一 John von Neumann (1949) 


第 9 章 可 选择 的 体系 结构 


9.1 概述 


在 前 面 的 章节 中 ， 我 们 重点 介绍 了 计算 技术 的 一 些 背景 知识 。 从 计算 机 科学 从 业者 的 角度 来 看 ， 
这 些 知 识 主 要 专注 于 单 处 理 器 的 计算 机 系统 。 通 过 学 习 ， 大 家 可 以 了 解 各 种 不 同 的 计算 机 硬件 的 功能 ， 
以 及 这 些 部 件 对 系统 的 整体 性 所 起 的 作用 。 这 些 知识 不 但 对 计算 机 的 硬件 设计 ， 而 且 对 高 效率 的 算法 
实现 都 是 至 关 重 要 的 。 大 多 数 人 都 是 通过 使 用 个 人 计算 机 和 工作 站 的 经 验 来 熟悉 计算 机 硬件 的 。 这 使 
得 他 们 没有 触及 到 计算 机 体系 结构 中 的 一 个 重要 领域 : 一些 可 选择 的 计算 机 体系 结构 。 因 此 ， 本 章 重 
点 介绍 一 些 超越 传统 汉 ， 诺 伊 曼 方法 的 计算 机 体系 结构 。 

本 章 将 讨论 RISC 计算 机 ， 使 用 指令 级 并 行 执行 的 体系 结构 和 多 重 处 理 的 体系 结构 (其 中 简要 地 
介绍 并 行 处 理 )。 首 先 从 臭名 昭彰 的 RISC 和 CISC 的 争论 开始 说 起 ， 让 大 家 了 解 这 两 种 指令 系统 
(ISA) 的 差异 及 其 相对 的 优点 和 缺点 。 接 下 来 会 介绍 一 种 不 同体 系 结构 的 分 类 方法 ， 并 且 研 究 如 何 分 
类 并 行 运算 的 各 种 体系 结构 。 随 后 ， 将 讨论 一 些 与 指令 级 的 并 行 结构 相关 的 主题 ， 重 点 强调 超标 量 的 
体系 结构 并 且 重 新 说 明 EPIC ( 显 式 并 行 的 指令 计算 机 ) 和 VLIW ( 超 长 指令 字 ) 的 设计 。 最 后 ， 简 要 
介绍 多 处 理 器 系统 和 一 些 实现 并 行 执行 的 新 方案 。 

在 20 世纪 80 年 代 早 期 ， 计 算 机 硬件 设计 师 开 始 重新 评价 各 种 不 同 的 体系 结构 理论 。 重 新 评价 的 
首 个 对 象 就 是 指令 系统 的 体系 结构 。 令 设计 师 感 到 非常 困惑 的 是 ， 为 什么 计算 机 需要 一 个 非常 复杂 的 
扩展 指令 集 ， 而 在 大 多 数 的 时 间 里 指令 集中 却 只 有 20% 的 指令 在 使 用 。 这 个 问题 导致 了 RISC 机 器 的 
发 展 。 在 第 4 章 和 第 5 章 中 , 已 经 引入 了 RISC 的 简单 介绍 ， 本 章 我 们 将 使 用 一 节 的 篇 幅 来 阐述 这 个 问 
题 。RISC 设计 的 深入 人 心 导致 了 一 种 独一无二 的 CISC 和 RISC 的 结合 。 现 在 ， 许 多 的 计算 机 体系 结 
构 都 使 用 RISC 的 核心 来 实现 CISC 体系 结构 。 

”在 第 4 章 和 第 5 章 中 介绍 了 一 些 新 的 体系 结构 ， 例 如 VLIW、EPIC 和 多 处 理 器 结构 ， 它 们 在 计算 
机 硬件 市 场 上 占据 着 一 个 较 大 的 份额 。 开 发 指令 级 并 行 执行 的 体系 结构 的 发 明 ， 导 致 了 一 种 新 技术 的 
诞生 。 利 用 这 种 技术 ， 计 算 机 可 以 在 程序 代码 实际 执行 之 前 就 能 够 准确 地 预测 出 程序 代码 中 的 分 支 转 
移 的 结果 。 基 于 这 些 预 测 的 指令 预 取 技 术 极 大 地 提高 了 计算 机 的 性 能 。 除 了 可 以 预测 下 一 条 要 提取 的 
指令 外 ， 高度 的 指令 级 并 行 技术 还 引发 了 诸如 推测 执行 之 类 的 新 观点 ， 这 样 处 理 器 可 以 在 实际 计算 前 
就 猜测 出 结果 值 。 

可 选择 的 体系 结构 也 包括 了 多 处 理 器 的 计算 机 系统 。 对 于 这 些 体系 结构 ， 我 们 是 借鉴 了 我 们 的 祖 
先 和 友善 的 牛 的 故事 。 如 果 我 们 使 用 一 头 牛 去 拉倒 一 棵 树 ， 而 这 标 树 又 太 大 的 话 ， 我 们 不 会 去 尝试 养 
一 头 更 大 的 牛 。 反 之 ， 我 们 会 同时 使 用 两 头 牛 。 多 重 处 理 的 体系 结构 与 多 头 牛 的 问题 非常 相似 。 当 需 
要 解决 一 些 困难 忒 手 的 问题 时 ， 就 需要 引 人 这 种 思想 。 但 是 ， 多 处 理 器 系统 带 给 了 我 们 一 些 前 所 未 有 
的 挑战 ， 特 别 是 关于 高 速 缓存 和 存储 器 一 致 性 问题 。 

值得 注意 的 是 ， 尽 管 我 们 正在 掌握 一 些 可 选择 的 体系 结构 ， 但 是 这 些 体 系 结构 的 高 性 能 都 是 建立 
在 提高 成 本 的 基础 之 上 的 。 当 前 ， 先 进 的 计算 机 系统 所 带 来 的 性 能 上 的 提高 和 它们 的 成 本 之 间 的 关系 
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是 非 线 性 的 。 在 大 多 数 情况 下 ， 成 本 的 增加 要 远 远 超过 所 获得 的 性 能 提高 。 这 也 就 使 得 我 们 难以 将 这 
些 体系 结构 加 入 到 主流 的 应 用 体系 结构 中 。 然 而 ， 新 的 体系 结构 在 市 场 上 也 有 它们 的 位 置 。 在 一 些 需 
要 高 度数 字 化 的 科学 和 工程 应 用 中 ， 常 常 需要 一 些 性 能 高 于 普通 单 处 理 器 系统 的 计算 机 。 对 于 这 类 应 
用 中 的 计算 机 来 说 ， 成 本 通常 都 不 是 问题 。 

在 学 习 本 章 时 ， 读 者 也 许 还 会 记得 在 第 1 章 中 曾 介绍 了 计算 机 发 展 的 不 同时 代 。 许 多 人 都 相信 我 
们 现在 已 经 进入 了 一 个 以 这 些 可 选择 的 体系 结构 为 基础 的 计算 机 新 时 代 ， 特 别 是 在 并 行 处 理 的 领域 。 


9.2 RISC 计算 机 


在 第 4 章 和 第 5 章 有 关 指 令 系 统 设计 的 内 容 中 ， 曾 经 介绍 了 RISC 计算 机 的 体系 结构 。 之 所 以 命名 
为 RISC (精简 指令 集 计算 机 )， 是 因为 与 CISC (复杂 指令 集 计 算 机 ) 相 比 ，RISC 计算 机 最 初 只 需 一 
个 较 小 的 指令 集 。 随 着 RISC 计算 机 的 不 断 发 展 ，RISC 中 的 术语 “精简 (reduced)” 已 经 变 得 有 些 用 
词 不 当 ， 现 在 就 更 不 用 说 了 。RISC 设计 的 最 初 想法 是 只 提供 一 组 能 够 执行 所 有 最 基本 的 操作 的 最 小 指 
令 集 : 数据 移动 、ALU 操作 和 分 支 转移 。 只 允许 显 式 的 1oad 和 store 指令 访问 存储 器 。 

实际 上 ， 设 计 复杂 指令 系统 是 因 存储 器 的 成 本 过 高 而 引起 的 。 如 果 每 条 指令 的 复杂 程度 越 高 ， 就 
意味 着 程序 变 得 越 小 ， 从 而 占用 更 少 的 存储 器 空间 。CISC 的 指令 系统 采用 长 度 可 变 的 指令 ， 这 样 可 以 
保持 简单 的 指令 尽量 短 ， 同 时 也 允许 拥有 比较 长 的 更 加 复杂 的 指令 。 另 外 ，CISC 的 体系 结构 中 还 包含 
大 量 能 够 直接 访问 存储 器 的 指令 。 这 样 ，CICS 的 结构 拥有 密集 、 强 大 和 变 长 的 指令 集 ， 也 就 导致 了 每 
条 指令 的 执行 需要 不 同 的 时 钟 周 期 。 某 些 复杂 指令 ， 特 别 是 访问 存储 器 的 指令 ， 往 往 需 要 数 百 个 时 钟 
周期 。 在 某 些 情 况 下 ， 计 算 机 的 设计 师 发 现 ， 为 了 允许 有 足够 的 时 间 来 完成 指令 ， 常 常 需要 减 慢 系统 
的 时 钟 频率 〈 可 以 使 时 钟 跳动 的 间隔 变 大 一 些 ) 。 这 样 就 导致 了 较 长 的 程序 执行 时 间 。 

人 类 语言 也 表现 出 一 些 RISC 和 CISC 的 特点 ， 我 们 可 以 将 人 类 语言 作为 理解 RISC 和 CISC 之 间 区 
别 的 一 个 很 好 的 类 比 。 假 如 你 有 一 个 中 国 的 笔友 。 你 们 俩 都 能 同时 流利 地 使 用 英语 和 中 文 说 写 。 虽 然 
你 们 都 喜欢 彼此 的 长 篇 大 论 ， 但 也 都 希望 将 双方 的 通信 费用 降 到 最 低 。 在 通信 时 ， 可 以 选择 使 用 昂贵 
的 航空 信纸 ， 这 样 能 节省 相当 多 的 邮资 ， 或 者 使 用 普通 信纸 而 支付 额外 的 邮票 费用 。 第 三 种 选择 就 是 
在 每 一 张 纸 上 书 写 尽 可 能 多 的 信息 。 

与 中 文 相 比 ， 英 语 简 单 而 元 长 。 中 文字 符 比 英语 单词 更 加 复杂 ， 一 个 需要 200 英文 字母 的 句子 可 能 
只 需 用 20 个 中 文字 符 。 用 中 文通 信和 需要 较 少 的 字符 ， 可 以 节省 纸张 和 邮资 。 但 是 ， 读 写 中 文 比较 费劲 ， 
原因 是 每 一 个 中 文 符号 包含 更 多 的 信息 。 英 语 单词 类 似 于 RISC 指令 ， 而 中 文字 符 则 更 类 似 于 CISC 指 
令 。 对 于 大 多 数 说 英语 的 人 来 说 ， 用 英语 “处 理 ” 信 件 花费 的 时 间 比 较 少 ， 但 是 也 需要 更 多 的 物理 资源 。 

有 很 多 的 报道 都 吹捧 RISC 结构 是 一 种 新 的 革命 性 的 设计 ， 而 RISC 的 起 源 却 要 追溯 到 20 世纪 70 
年 代 中 期 。IBM 公司 的 John Cocke 的 早期 工作 撤 下 了 RISC 的 种 子 。1975 年 ，Cocke 开始 建造 他 的 实 
验 模型 801 主机 。 这 个 系统 最 初 几 乎 没有 受到 人 们 的 关注 ， 直 到 许多 年 后 才 公 开机 器 的 细节 。 这 期 间 ， 
David Patterson 和 David Ditzel 于 1980 年 发 表 了 一 篇 得 到 广泛 称赞 的 论文 ,，“ 精 简 指 令 集 计算 机 的 案 
例 ”。 这 篇 文章 开创 了 对 计算 机 体系 结构 设计 的 一 种 变革 性 的 新 思路 ， 并 将 首 字母 的 缩写 词 CISC 和 
RISC 写 进 了 计算 机 科学 的 词典 中 。 这 种 由 Patterson 和 Ditzel 构思 的 新 结构 提倡 使 用 简单 的 指令 ， 而 
且 所 有 的 指令 都 有 相同 的 长 度 。 这 样 一 来 ， 每 条 指令 都 执行 较 少 的 任务 ， 然 而 每 条 指令 的 执行 所 需要 
的 时 间 却 是 固定 的 和 可 以 预测 的 。 

CISC 机 器 上 进行 的 编程 结果 为 RISC 机 器 提供 了 数据 上 的 支持 。 这 些 研究 表明 ， 数 据 移动 指令 大 
概 占 总 指令 的 45%，ALU 操作 〈 包 括 算术 运算 、 比 较 操 作 和 逻辑 操作 ) 占 总 指令 的 25%， 而 分 支 转 
移 指 令 (或 者 说 程序 流 的 控制 ) 则 占 了 30% 。 尽 管 在 CISC 机 器 中 有 大 量 的 复杂 指令 ， 但 却 是 很 少 使 
用 。 这 一 发 现 ， 并 伴随 着 大 量 较 便宜 的 存储 器 的 出 现 , 以 及 超大 规模 集成 电路 (VLSI) 技术 的 发 展 ， 
导致 了 各 种 不 同类 型 的 体系 结构 的 开发 。 价 格 便宜 的 存储 器 就 意味 着 程序 可 以 占用 更 多 的 存储 器 空间 。 
这 样 ， 我 们 可 以 使 用 一 些 简 单 的 ， 可 预测 的 指令 组 成 较 长 的 程序 ， 来 代替 由 可 变 长 度 的 复杂 指令 所 组 
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成 的 较 短 的 程序 。 简 单 指令 的 执行 允许 使 用 较 短 的 时 钟 周期 。 另 外 ， 较 少 的 指令 系统 也 意味 着 在 计算 
机 芯片 中 需要 更 少 的 晶体 管 。 晶 体 管 数目 的 减少 使 得 芯片 的 制造 成 本 更 加 便宜 ， 可 以 有 更 多 的 芯片 空 
间 来 实现 其 他 的 功能 。 指 令 的 可 预测 性 和 VLSI 技术 的 发 展 允 许 各 种 各 样 的 性 能 增强 技术 可 以 利用 计 
算 机 的 硬件 来 实现 ， 例 如 流水 线 操作 。 而 CISC 结构 却 不 提供 这 些 性 能 提升 的 机 会 。 

可 以 使 用 如 下 的 基本 的 计算 机 性 能 等 式 来 量化 RISC 和 CISC 的 差别 : 

时 间 ._ 时间 、 周 期 数 .指令 数 

程序 周期” 指令 程序 

可 以 通过 程序 的 执行 时 间 来 度量 计算 机 性 能 。 计 算 机 的 性 能 与 时 钟 周期 、 每 条 指令 需要 的 时 钟 周期 数 
和 程序 所 包含 的 指令 数 成 正比 。 如 果 可 能 的 话 ， 缩 短 时 钟 的 周期 ， 就 能 够 改善 RISC 和 CISC 的 性 能 。 所 不 
间 的 是 ，CISC 机 器 通过 减少 程序 中 的 指令 数 达到 性 能 提升 的 效果 ， 而 RISC 则 通过 将 每 条 指令 需要 的 时 钟 周 
期 数 减 至 最 少 来 增强 计算 机 的 性 能 。 这 两 种 体系 结构 在 相同 的 时 间 内 差不多 产生 相同 的 结果 。 在 门 电路 的 层 
次 上 ， 这 两 种 系统 完成 等 量 的 工作 。 但 是 ， 在 程序 层次 与 门 电路 层次 之 间 又 会 发 生 什么 样 的 情况 呢 ? 

CISC 机 器 是 利用 微 代 码 来 处 理 指令 的 复杂 性 问题 。 微 代码 会 告诉 处 理 器 如 何 去 执 行 每 一 条 指令 。 因 为 
执行 效果 的 原因 ， 微 代码 通常 是 紧凑 且 有 效率 的 ， 而 且 必须 是 正确 无 误 的 。 然 而 ， 微 代码 的 效率 受制 于 可 变 
长 度 的 指令 系统 ， 不 同 长 度 的 指令 会 减 慢 译 码 的 操作 过 程 。 而 且 在 可 变 长 度 的 指令 系统 中 ， 每 条 指令 所 要 求 
的 时 钟 周期 数 也 会 有 所 不 同 ， 这 样 就 很 难 实现 指令 的 流水 线 操作 。 另 外 ， 微 代码 是 在 指令 从 存储 器 中 取出 后 
才 对 每 条 指令 进行 解释 。 这 种 额外 的 指令 转换 过 程 也 会 消耗 时 间 。 越 是 复杂 的 指令 集 ， 查 找 指 令 所 需要 的 时 
间 就 越 多 。 同 时 ， 也 需要 花费 更 多 的 时 间 使 计算 机 的 硬件 系统 适合 于 这 些 指 令 的 执行 。 

RISC 体系 结构 采用 的 是 一 种 不 同 的 解决 方案 。 大 部 分 RISC 指令 的 执行 是 在 一 个 时 钟 周期 内 完 
成 。 为 了 实现 指令 的 加 速 执行 ，RISC 结构 使 用 硬件 连 线 控制 来 取代 CISC 结构 中 的 微 程序 控制 ， 从 而 . 
加 快 了 指令 的 执行 。 这 就 使 得 RISC 机 器 比较 容易 实现 指令 的 流水 线 操作 ， 但 是 要 在 硬件 层次 上 处 理 
指令 的 复杂 性 问题 非常 困难 。 在 RISC 系统 中 ， 有 关 指 令 的 复杂 性 问题 已 经 从 指令 集中 移 除 ， 将 它 放 
到 编译 器 域 的 层次 上 进行 处 理 。 

为 了 说 明 起 见 ， 我 们 来 看 下 面 的 一 条 指令 。 假 如 要 计算 乘积 5X10 的 结果 。 在 CISC 机 器 上 ， 程 序 
的 代码 可 能 会 是 : 

mov ax，10 


mov bx, 5 
mul bx, ax 


一 个 最 小 化 的 RISC 指令 系统 中 没有 乘法 指令 。 因 此 ， 在 RISC 系统 中 ， 对 这 个 乘法 问题 的 处 理 可 能 为 ， 


mov ax, 0 
mov bx, 10 
mov cx, 5 
Begin: add ax, bx 
loop Begin :causes a loop cx times 


虽然 CISC 代码 比较 简短 ， 但 是 需要 执行 更 多 的 时 钟 周 期 。 假 设 在 这 两 种 体系 结构 中 ， 对 于 寄存 
器 到 寄存 器 的 移动 ， 加 法 运算 和 循环 运算 ， 每 一 个 运算 都 只 占用 一 个 时 钟 周 期 。 同 样 ， 这 里 假设 乘法 
指令 需要 30 个 时 钟 周期 * 。 比 较 上 面 的 两 种 代码 段 : 
CISC 指令 : 

总 的 时 钟 周期 = (2 次 移动 X1 个 时 钟 周 期 ) 十 (1 次 乘法 X30 个 时 钟 周期 ) 二 32 个 时 钟 周 期 
RISC 指令 : 

总 的 时 钟 周期 = (3 次 移动 X1 个 时 钟 周 期 ) 十 (5 次 加 法 X1 个 时 钟 周期 ) 十 

(5 次 循环 X1 个 时 钟 周期 ) 二 13 个 时 钟 周期 








日 ”这 并 不 是 一 个 不 实际 的 数目 。 在 Intel 8088 上 ， 两 个 16 位 数 的 乘法 运算 需要 133 个 时 钟 周期 。 
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事实 说 明 ，RISC 需要 的 时 钟 周期 数 通 常 少 于 CISC 的 时 钟 周期 数 。 应 该 了 解 的 是 ， 即 使 RISC 需 
要 更 多 的 程序 指令 ， 但 是 程序 在 RISC 系统 上 的 实际 执行 时 间 却 要 比 CISC 的 执行 时 间 短 。 这 就 是 
RISC 设计 背后 的 主要 动机 。 

我 们 已 经 提 过 降低 指令 的 复杂 度 可 以 使 计算 机 芯片 的 结构 更 加 简单 。 以 前 在 CISC 指令 的 执行 过 
程 中 ， 晶 体 管 被 用 作为 数据 管道 、 高 速 缓 存 和 寄存 器 。 在 这 三 者 中 ， 寄 存 器 提供 了 改善 计算 机 人 性 能 的 
最 大 潜力 。 因 此 ， 增 加 寄存 器 的 数目 和 用 全 新 的 方式 使 用 寄存 器 是 十 分 有 意义 的 。 一 种 寄存 器 的 创新 
的 使 用 方式 是 使 用 寄存 器 窗口 组 (register window sets)。 虽 然 这 种 方式 不 像 RISC 体系 结构 的 其 他 创 
新 技术 被 人 们 广泛 地 接受 ， 然 而 寄存 器 开 窗口 是 一 个 非常 令 人 感 兴趣 的 观点 ， 在 此 将 做 简要 的 介绍 。 

高 级 语言 的 效率 取决 于 程序 的 模块 化 。 过 程 调 用 和 参数 传递 就 是 使 用 这 些 模块 所 自然 带 来 的 副 作 
用 。 调 用 一 个 过 程 是 一 个 比较 重大 的 任务 。 它 包括 保存 一 个 返回 地 址 、 保 存 寄 存 器 的 值 、 传 递 参数 
(或 者 将 参数 压 人 堆栈 ， 或 者 使 用 寄存 器 ) 、 分 支 转移 到 子 程序 ， 并 执行 这 个 子 程序 。 直 到 子 程序 完成 ， 
必须 保存 参数 值 的 修改 。 在 返回 调用 程序 时 的 执行 之 前 ， 必 须 恢复 先前 的 寄存 器 的 值 。 保 存 寄 存 器 、 
传递 参数 和 恢复 寄存 器 都 需要 消耗 大 量 的 工作 量 和 系统 资源 。RISC 的 芯片 中 的 数 百 个 寄存 器 ， 要 实现 
保存 和 恢复 的 序列 操作 简化 只 需 简 单 地 改变 寄存 器 的 环境 即 可 。 

为 了 充分 地 理解 寄存 器 窗口 的 这 个 概念 ， 可 以 尽力 想像 将 所 有 的 寄存 器 分 成 若干 个 组 。 当 一 个 程 
序 在 某 个 环境 下 执行 时 ， 仅 仅 只 有 一 个 特定 的 寄存 器 组 是 可 见 的 。 如 果 这 个 程序 改变 到 另 一 个 环境 中 
〈 例 如 调用 一 个 过 程 ) 执行 ， 那 么 新 环境 中 的 可 见 寄存 器 组 就 会 发 生变 化 。 例 如 ， 当 主 程序 在 运行 时 ， 
可 能 看 见 的 只 是 从 第 0 个 寄存 器 到 第 9 个 寄存 器 的 寄存 器 组 。 当 调用 某 个 特定 的 过 程 时 ， 可 能 看 到 的 
组 将 是 从 第 10 个 寄存 器 到 第 19 个 寄存 器 。 通 常 ， 一 个 实际 的 RISC 体系 结构 中 包含 16 个 寄存 器 组 
(或 者 称 为 窗口 )， 而 每 一 个 寄存 器 组 中 有 32 个 寄存 器 。 在 任意 时 刻 ，CPU 都 受到 限制 只 能 在 某 个 单 
一 的 寄存 器 窗口 中 工作 。 因 此 ， 从 程序 员 角 度 来 看 ， 只 有 32 个 可 用 的 寄存 器 。 

寄存 器 窗口 本 身 对 于 过 程 调 用 或 参数 传递 并 没有 帮助 。 但 是 ， 如 果 我 们 对 这 些 窗口 进行 仔细 地 重 
秋 覆 盖 ， 那么 从 一 个 模块 到 另 一 个 模块 的 参数 传递 活动 就 变 成 了 只 需 简单 地 从 一 个 寄存 器 组 移动 到 另 
一 个 组 。 为 了 实现 参数 的 传递 ， 必 须 共享 的 寄存 器 的 两 个 组 需要 进行 覆盖 。 这 可 以 通过 将 寄存 器 窗口 
划分 成 不 同 的 分 区 来 实现 。 其 中 包括 ; 全 局 寄存 器 〈 对 所 有 窗口 共用 ) 、 局 部 寄存 器 (属于 当前 窗口 )、 
输入 寄存 器 (与 前 一 个 窗口 的 输出 寄存 器 覆盖 )， 和 输出 寄存 器 (与 下 一 个 窗口 的 输入 寄存 器 覆盖 )。 
当 CPU 从 一 个 过 程 转换 到 下 一 个 过 程 时 ， 它 就 在 不 同 的 寄存 器 窗口 之 间 进 行 切 换 。 这 种 重 又 的 窗口 允 
许 实现 参数 的 “传递 ”， 只 需 简 单 地 从 调用 模块 中 的 输出 寄存 器 改变 到 被 调用 模块 的 输入 寄存 器 。 一 个 
当前 窗口 指针 (current window pointer，CWP) 可 以 指示 任意 时 刻 正 被 使 用 的 寄存 器 窗口 组 。 

下 面 ， 我 们 考虑 过 程 1 (procedure one) 调用 过 程 2 (procedure two) 的 假想 情况 。 在 每 一 组 的 32 
个 寄存 器 中 ， 假 设 有 8 个 寄存 器 是 全 局 的 ，8 个 是 局 部 的 ，8 个 用 作 输 入 和 8 个 用 作 输 出 。 在 过 程 1 调 
用 过 程 2 时 ， 所 有 需要 传递 的 参数 都 存 
放 到 过 程 1 的 输出 寄存 器 组 中 。 一旦 过 
程 2 开始 执行 ， 这 些 寄存 器 就 变 成 了 过 
程 2 的 输入 寄存 器 组 。 这 个 过 程 如 图 9-1 
所 示 。 

值得 注意 的 一 个 重要 信息 是 ，RISC 
机 器 中 的 寄存 器 组 具有 循环 使 用 的 特性 。 
对 于 具有 高 度 嵌 套 的 程序 来 说 ， 有 可 能 
会 占 满 机 器 所 提供 的 所 有 寄存 器 。 如 果 
发 生 这 种 情况 ， 主 存储 器 就 会 接管 寄存 
器 的 工作 ， 把 具有 最 小 编号 的 寄存 器 窗 
口 存储 在 主 存储 器 中 ， 窗 口中 所 包含 的 图 9-1 重合 的 寄存 器 窗口 


过 程 ! 
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是 来 自 最 早 过 程 激 活 中 的 值 。 最 高 编号 的 寄存 器 (最 新 近 激 活 的 寄存 器 ) 然后 会 回 绕 到 最 低 编号 的 寄 
存 器 。 当 从 执行 的 过 程 返回 时 ， 九 套 的 层次 降低 ， 计 算 机 会 按照 原来 的 保存 顺序 从 存储 器 中 恢复 寄存 
器 的 值 。 

除了 简单 外 ，RISC 机 器 中 的 定 长 指令 和 高 效率 的 流水 线 极 大 地 提高 了 这 种 体系 结构 的 处 理 速 度 。 
指令 越 简单 ， 占 用 的 芯片 空间 就 越 小 。 这 样 不 仅仅 会 带 来 更 多 的 可 用 空间 ， 而 且 在 芯片 的 设计 和 生产 
时 也 会 变 得 更 轻松 和 省 时 。 

应 该 指出 的 是 ， 要 把 现在 的 处 理 器 分 类 为 RISC 体系 结构 和 CISC 体系 结构 已 经 变 得 越 来 越 困难 。 
这 些 体 系 结构 的 区 分 界线 也 已 经 变 得 很 模糊 。 现 在 一 些 流行 的 体系 结构 同时 采用 RISC 和 CISC 两 种 方 
式 。 如 果 我 们 浏览 一 些 新 的 芯片 手册 ， 就 会 发 现 现 在 的 RISC 机 器 变 得 越 来 越 奢 侈 ， 甚 至 有 一 些 比 
CISC 机 器 更 复杂 的 指令 。 例 如 ，RISC 体系 结构 的 PowerPC 计算 机 比 CISC 体系 结构 的 Pentium 系列 
有 具 有 更 大 的 指令 集 。 随 着 VLSI 技术 不 断 地 把 晶体 管制 造 得 更 小 更 便宜 ， 指 令 集 的 大 小 现在 已 经 很 少 
成 为 CISC 和 RISC 之 间 争 论 的 话题 ， 而 寄存 器 的 使 用 和 装 入 载 /存储 (Load/store) 式 的 体系 结构 慢 慢 
变 成 了 争论 的 热点 议题 。 

正如 上 面 所 述 ， 表 9-1 中 谨慎 地 总 结 了 一 些 有 关 RISC 体系 结构 和 CISC 体系 结构 之 间 的 典型 区 别 。 


表 9-1 RlSC 与 CISC 机 器 的 对 比 





多 寄存 器 组 ， 通 常 由 256 个 以 上 的 寄存 器 组 成 单 寄存 器 组 ， 典 型 的 寄存 器 总 数 为 6 到 16 个 

每 条 指令 允许 有 三 个 寄存 器 操作 数 〈 例 如 ，add Rl， 
R2，R3) 

通过 高 效率 的 片上 (on-chip〉 寄存 器 窗口 实行 参数 





每 条 指令 允许 有 一 个 或 两 个 寄存 器 操作 数 〈 例 如 ，add R1，R2) 


利用 低 效 率 的 片 外 (off-chip〉 存储 器 实现 参数 传递 

















传递 
单 周 期 指令 (load 和 store 除外 ) 多 周期 (multiple-cycle) 指令 
硬件 连 线 控制 微 程序 控制 
高 度 流水 线 作业 低 度 流水 线 作业 
数目 较 少 的 单 指令 数目 众多 的 复杂 指令 
固定 长 度 指令 ”| 可 变 长 度 指令 
使 用 编译 器 解决 复杂 性 问题 利用 微 代码 解决 复杂 性 问题 
只 有 装载 和 存储 指令 才能 访问 存储 器 许多 指令 都 可 以 访问 存储 器 
寻 址 方式 较 少 许多 寻 址 方式 


我 们 已 经 提 过 ， 尽 管 有 许多 报到 资料 盛赞 RISC 设计 的 革命 性 创新 ， 许 多 在 RISC 机 器 上 使 用 的 思 
想 〈 包 括 流水 操作 和 简单 指令 ) ， 实 际 上 在 20 世纪 60 年 代 和 70 年 代 的 计算 机 主机 就 已 经 实现 了 。 许 
多 新 设计 并 不 是 真正 意义 上 的 新 设计 ， 仅 仅 只 是 简单 的 轮回 应 用 。 创 新 并 不 一 定 意味 着 发 明 一 个 新 的 
轮子 ， 简 单 的 创新 可 能 是 发 现 了 现 有 的 这 个 轮子 的 一 种 最 好 的 使 用 方法 。 这 也 为 你 将 来 从 事 计 算 领 域 
的 工作 提供 一 个 很 好 的 启发 。 


9.3 FLYNN 分 类 方法 


在 过 去 的 许多 年 ， 为 了 找到 一 种 分 类 计算 机 体系 结构 的 满意 方法 已 经 进行 了 多 次 尝试 。 尽 管 没有 
一 种 方法 是 完美 的 ， 但 是 今天 被 大 家 最 广泛 接受 的 分 类 方法 是 1972 年 由 Michael Flynn 提出 的 分 类 方 
法 。 富 林 分 类 方法 (Flynn”s taxonomy) 主要 考虑 两 大 因素 : 指令 的 数目 和 流入 处 理 器 的 数据 流 的 数 
目 。 一 台 计 算 机 可 以 有 一 个 或 多 个 的 数据 流 ， 而 且 可 能 是 一 个 或 多 个 处 理 器 在 这 个 数据 上 工作 。 这 就 
提供 了 4 种 可 能 的 组 合 ，SISD ( 单 指令 流 ， 单 数据 流 )、SIMD ( 单 指令 流 ， 多 数据 流 )、MISD (多 指 
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令 流 ， 单 数据 流 ) 和 MIMD (多 指令 流 ， 多 数据 流 )。 

单 处 理 器 是 SISD 机 器 。SIMD 机 器 上 有 一 个 单一 的 控制 点 ， 能 够 在 多 个 数据 值 上 执行 相同 的 指令 。 
SIMD 的 类 别 包 括 阵 列 处 理 器 、 矢 量 处 理 器 和 脉动 阵列 (systolic arrays) 。MISD 机 器 具有 在 相同 的 数 
据 流 上 操作 的 多 个 指令 流 。MIMD 机 器 采用 多 个 控制 点 ， 且 具有 独立 的 指令 和 数据 流 。 多 处 理 器 和 大 
多 数 现代 的 并 行 处 理 系统 都 是 MIMD 机 器 。SIMD 机 器 的 设计 比 MIMD 机 器 简单 ， 但 是 也 十 分 缺乏 灵 
活性 。 所 有 的 SIMD 多 处 理 器 都 必须 同时 执行 相同 的 指令 。 如 果 考 虑 到 这 一 点 ， 那 么 执行 某 些 类 似 分 
支 转移 条 件 的 简单 事情 可 能 代价 马上 就 会 变 得 高 昂 。 

Flynn 分 类 法 在 某 些 方面 存在 缺点 。 第 一 ， 对 于 MISD 机 器 ， 能 够 运行 的 应 用 程序 (如 果 有 的 话 ) 
很 少 。 其 二 ，Flynn 假定 并 行 执行 都 是 向 构 的 。 然而， 一 组 处 理 器 的 集合 可 能 是 间 构 ， 也 可 能 是 异 构 
的 。 一 台 机 器 可 以 理所当然 地 拥有 4 个 独立 的 浮 点 加 法 器 、2 个 乘法 器 和 1 个 单一 的 整数 单元 。 因 此 ， 
这 台 机 器 可 以 并 行 地 执行 7 个 操作 ， 但 是 却 不 容易 满足 Flynn 的 分 类 系统 。 

这 种 分 类 方法 遇 到 的 另外 一 个 问题 是 MIMD 的 类 别 。 一 个 多 处 理 器 的 体系 结构 属于 这 种 类 别 ， 但 
是 却 没有 考虑 到 处 理 器 之 间 是 如 何 进行 连接 的 ， 也 没有 考虑 到 处 理 器 是 如 何 看 竺 存储器 的 。 还 有 几 种 
方法 试图 细 分 MIMD 的 类 别 。 修 改 的 建议 包括 将 MIMD 细 分 为 共享 存储 器 和 不 共享 存储 器 的 两 类 不 
同 的 系统 ， 以 及 按照 系统 是 否 是 基于 总 线 或 总 线 切换 来 对 CPU 进行 分 类 。 

对 于 共享 存储 器 的 系统 ， 所 有 的 处 理 器 都 可 以 访问 全 局 存储 器 ， 并 且 处 理 器 之 间 通 过 共享 变量 进 
行 通信 ， 就 像 在 单 处 理 器 上 所 进行 的 处 理 过 程 一 样 。 如 果 多 处 理 器 不 共享 存储 器 ， 那 么 每 一 个 处 理 器 
都 必须 拥有 自己 的 一 部 分 存储 器 。 结 果 ， 所 有 的 处 理 器 都 必须 通过 消息 传递 的 方式 来 进行 通信 ， 这 种 
通信 方式 的 代价 昂贵 而 且 效 率 低下 。 有 些 人 认为 使 用 存储 器 作为 划分 硬件 的 一 个 决定 性 因素 会 带 来 一 
个 问题 ， 那 就 是 共享 存储 器 和 消息 传递 实际 上 是 一 种 编程 模型 ， 而 不 是 一 种 硬件 模型 。 因 此 ， 它 们 更 
适合 属于 系统 软件 的 范 团 。 

并 行 体系 结构 的 两 个 主要 范式 是 SMP (对 称 多 处 理 机 ，symmetric multi-processors) 和 MPP (大 
量 信 息 并 行 处 理 机 ，massively parallel processors)。 它 们 都 是 MIMD 体系 结构 ， 但 是 它们 在 使 用 存储 
器 上 有 区 别 的 。SMP 机 器 ， 例 如 一 个 双 处 理 器 的 Intel PC 和 一 个 256 处 理 器 的 Origin 3000 之 间 共 享 存 
储 器 。 而 对 于 MPP 处 理 器 ， 例 如 nCube、CM5 和 Cray T3E 处 理 器 之 间 就 不 能 共享 存储 器 。 这 些 特殊 
的 MPP 机 器 通常 会 在 一 个 单个 的 大 机 柜 内 安装 几 千 个 CPU 和 连接 数 百 千 兆 字 节 的 存储 器 ， 这 些 系统 
的 价格 通常 高 达 几 百 万 美元 。 

起 初 ， 术 语 MPP 是 用 来 描述 紧密 式 耦 合 的 多 个 SIMD 处 理 器 ， 如 Connection Machine 和 Good- 
years”s MPP。 然 而 现在 ， 术 语 MPP 用 来 表示 有 多 个 独立 节点 和 专用 存储 器 的 并 行 体 系 结构 ， 所 有 的 
这 些 节点 通过 网 络 进 行 通信 。 区 分 SMP 和 MPP ( 指 现在 的 定义 ) 的 一 个 简单 方法 如 下 : 

MPP= 许多 处 理 器 十 分 布 式 存 储 器 十 通过 网 络 通信 
然而 ， 

SMP = 几 个 处 理 器 十 共享 存储 器 十 通过 存储 器 通信 

分 布 式 计算 是 MIMD 体系 结构 的 另外 一 个 例子 。 分 布 式 计算 (distributed computing) 通常 定义 为 
一 组 网 络 连 接 的 计算 机 协同 作业 来 解决 某 个 问题 。 然 而 ， 这 种 合作 可 以 通过 多 种 不 同 的 方式 进行 。 

工作 站 网 络 (network of workstations，NOW) 是 指 一 组 按 并 行 方式 工作 的 分 布 式 工 作 站 的 集合 ， 
而 且 网 络 工作 站 的 各 个 节点 并 不 作为 一 个 常规 的 工作 站 使 用 。NOW 通常 由 异 构 系 统 组 成 ， 有 不 同类 
型 的 处 理 器 和 软件 ， 并 通过 因特网 进行 通信 。 个 人 用 户 必须 在 网 络 上 建立 适当 的 连接 才能 加 入 到 并 行 
计算 。 工 作 站 群集 (cluster of workstations，COW) 类 似 于 NOW 的 工作 站 集合 ， 但 它 却 要 求 有 一 个 
单一 的 实体 来 进行 管理 。 这 种 结构 的 节点 通常 具有 通用 的 软件 ， 如 果 一 个 用 户 能 访问 其 中 的 某 个 节点 ， 
那么 他 也 就 能 够 访问 所 有 的 节点 。 专 用 群集 式 并 行 计 算 机 (dedicated cluster parallel computer， 
DCPC) 是 一 种 专门 连接 起 来 从 事 特定 的 并 行 计 算 工 作 的 工作 站 集合 。 这 些 工 作 站 都 有 相同 的 软件 和 文 
件 系统 ， 并 实行 单一 实体 的 管理 方式 。 这 些 工作 站 之 间 通 过 因特网 进行 通信 ， 但 是 并 不 会 作为 普通 的 


290 第 9 章 





工作 站 使 用 。PC 机 群 (piles of PCs，POPC) 是 指 一 种 专门 针对 使 用 异 构 硬件 来 构建 一 个 并 行 系统 的 
群集 。 一 般 来 说 ，DCPC 配备 数目 相对 较 少 、 但 价格 较 高 和 速度 较 快 的 组 件 ， 而 POPC 却 使 用 大 量 的 
速度 慢 但 相对 较 便宜 的 节点 。 

1994 年 ， 由 Goddard 太空 飞行 中 心 的 Thomas Sterling 和 Donald Becker 引进 的 BEOWULF 计划 ， 
就 是 一 个 POPC 的 体系 结构 。 它 成 功 地 用 一 个 特殊 设计 的 软件 将 各 种 不 同 的 计算 机 硬件 平台 捆绑 在 一 
起 ， 使 得 这 个 体系 结构 看 起 来 和 感觉 上 就 是 一 个 统一 的 并 行 机 器 。BEOWULEF 网 络 上 的 节点 都 是 通过 
一 个 专用 网 络 进行 连接 的 。 如 果 你 有 一 台 老 式 的 Sun SPARC 计算 机 、 若 干 486 的 机 器 、 一 台 DEC Al- 
pha (或 者 就 只 是 一 大 堆 老 式 的 Intel 机 器 !) 和 一 种 将 这 些 机 器 连接 网 络 方法 ， 那 么 就 可 以 安装 BEO- 
WULEF 软件 来 创建 一 个 属于 你 个 人 的 、 却 是 功能 非常 强大 的 并 行 计算 机 。 

Flynn 分 类 法 最 近 已 经 扩大 到 包括 SPMD (单个 程序 多 个 数据 ) 的 体系 结构 。 一 个 SPMD 由 多 个 
处 理 器 组 成 ， 其 中 每 一 个 处 理 器 都 有 自己 的 数据 集合 和 程序 存储 器 。 同 一 个 程序 在 各 个 处 理 器 上 执行 ， 
并 在 不 同 的 全 局 控制 点 上 进行 同步 。 虽 然 每 个 处 理 器 都 装载 同一 个 程序 ， 但 是 每 个 处 理 器 可 能 执行 不 
同 的 指令 。 例 如 ， 一 个 程序 可 能 具有 类 似 如 下 的 代码 : 


If myNodeNum = 1 do this, else do that 


这 样 ， 不 同 的 节点 执行 同一 程序 中 的 不 同 指令 。SPMD 实际 上 是 在 MIMD 机 器 上 使 用 的 一 个 编程 
范例 ， 但 它 却 与 SIMD 不 同 ， 因 为 SIMD 中 的 各 个 处 理 器 在 同一 时 刻 做 的 是 不 同 的 事情 。 超 级 计算 机 
通常 使 用 一 个 SPMD 的 设计 。 

在 Flynn 分 类 法 上 面 的 某 个 层次 上 ， 需 要 再 添加 一 种 特性 。 这 就 是 区 分 体系 结构 是 利用 指令 驱动 
的 ， 还 是 利用 数据 驱动 的 。 经 典 的 汉 。 诺 伊 曼 体系 结构 是 属于 指令 驱动 类 型 。 所 有 的 处 理 器 活动 都 由 
一 个 程序 代码 序列 来 决定 。 程 序 指令 作用 于 数据 。 而 数据 驱动 类 型 ， 或 者 说 数据 流 类 型 的 体系 结构 却 
恰好 相反 。 在 这 里 ， 数 据 的 特性 决定 了 处 理 器 的 事件 序列 。 第 9. 5 节 将 详细 地 研究 这 种 思想 。 

在 添加 了 数据 流 计算 机 以 及 对 MIMD 分 类 法 进行 了 细 化 之 后 ， 得 到 如 图 9-2 所 示 的 分 类 方法 。 也 
许 大 家 希望 在 接 下 来 章节 的 学 习 中 会 用 到 这 个 分 类 图 。 我 们 先 从 树 的 左边 分 支 开始 ， 介 绍 与 SIMD 和 
MIMD 体系 结构 相关 的 内 容 。 





图 9-2 计算 机 体系 结构 的 分 类 方法 


9.4 并 行 和 多 处 理 器 体系 结构 


自从 计算 科学 开始 以 来 ， 科 学 家 一 直 致 力 于 制造 各 种 计算 机 器 来 更 好 更 快 地 解决 各 种 问题 。 小 型 
化 的 技术 促进 了 电路 性 能 的 改善 ， 以 及 能 够 在 一 个 芯片 上 放置 更 多 的 元 器 件 。 计 算 机 的 时 钟 频率 也 变 
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得 更 快 ， 现 在 的 CPU 能 在 干 兆 赫兹 的 时 钟 频率 下 工作 。 然 而 ， 大 家 都 知道 有 些 物 理 障碍 控制 了 单 处 理 
器 〈single-processor) 的 性 能 的 提高 。 例 如 ， 热 和 电磁 效应 的 影响 会 限制 芯片 中 晶体 管 的 密度 。 即 使 
这 些 问题 都 已 解决 (当然 还 不 清楚 是 在 什么 时 候 )， 处 理 器 速度 总 是 会 受到 光速 制约 。 除 了 这 些 物理 上 
的 限制 因素 外 ， 还 有 经 济 上 的 问题 。 从 某 种 意义 上 来 说 ， 不 断 提升 处 理 器 的 速度 所 带 来 的 费用 将 可 能 
超过 人 们 的 承受 能 力 。 最 终 ， 将 导致 无 法 继续 提升 处 理 器 的 性 能 。 当 然 ， 一 种 可 行 的 解决 办 法 是 将 计 
算 负担 分 配 到 多 个 处 理 器 上 。 正 是 因为 这 些 原 因 ， 并 行 执行 的 概念 变 得 越 来 越 流行 。 

然而 ， 值 得 注意 的 是 ， 并 不 是 所 有 的 应 用 程序 都 能 够 从 并 行 执行 中 受益 。 例 如 ， 多 重 处 理 的 并 行 
机 制 会 增加 开销 ， 如 在 处 理 同 步 问 题 和 其 他 过 程 管理 方面 的 开销 。 如 果 一 个 应 用 程序 并 不 适合 并 行 执 
行 的 解决 方案 ， 那 么 将 它 移 植 到 一 个 多 重 处 理 并 行 结构 上 ， 通 常会 得 不 偿 失 。 

如 果 程 序 执行 正确 ， 并 行 执行 机 制 通常 能 带 来 较 高 的 吞吐 量 ， 更 好 的 容错 性 ， 以 及 一 个 更 吸引 人 
的 性 价 比 。 虽 然 并 行 执行 可 以 大 幅度 地 提 和 着 程序 处 理 的 速度 ， 但 是 这 种 加 速决 不 是 完美 无 缺 的 。 如 果 
有 个 处 理 器 以 并 行 处 理 的 方式 运行 ， 那么 理想 的 加 速率 就 意味 着 一 个 计算 任务 能 够 在 原来 1/n 的 时 
间 内 完成 ， 也 就 是 系统 的 处 理 能 力 会 提升 n 倍 ， 或 者 说 运行 时 间 降 低 到 原来 的 n 分 之 一 。 

回忆 Amdahl 定理 ， 就 可 以 认识 到 为 什么 这 种 完美 的 加 速 是 不 可 能 的 。 如 果 两 个 处 理 部 件 分 别 以 
两 个 不 同 的 速度 运行 ， 那 个 较 慢 的 速度 将 会 起 主导 的 作用 。 这 个 定理 同样 也 决定 了 使 用 并 行 体系 结构 
解决 某 个 问题 所 能 得 到 的 加 速率 。 不 管 你 把 一 个 应 用 程序 的 并 行 化 处 理 得 多 好 ， 总 是 会 有 一 小 部 分 工 
作 必 须 由 某 个 处 理 器 按 顺 序 执行 。 在 这 个 顺序 处 理 完成 之 前 ， 其 他 的 处 理 器 除了 等 待 外 什么 工作 都 不 
能 做 。 这 其 中 蕴含 的 意义 是 ， 任 何 一 种 算法 都 会 有 按 顺 序 执行 的 部 分 ， 这 些 顺 序 执行 最 终 会 制约 通过 
多 处 理 器 执行 所 能 达到 的 加 速 。 顺 序 处 理 的 部 分 越 大 ， 则 应 用 一 个 多 重 处 理 的 并 行 结构 的 效果 就 会 
越 差 。 

使 用 多 处 理 器 执行 单一 任务 仅仅 是 许多 并 行 处 理 机 制 中 的 一 种 。 在 前 面 的 章节 中 ， 我 们 曾经 介绍 
了 几 种 并 行 执行 的 机 制 ， 其 中 包括 流水 操作 、VLIW 和 ILP 的 方法 。 并 和 阐述 了 每 一 种 特定 类 型 的 并 行 
机 制 产生 的 动机 。 其 他 类 型 的 并 行 执行 的 体系 结构 可 以 处 理 多 〈 或 者 是 并 行 ) 数据 问题 。 这 类 例子 中 
包括 SIMD 机 器 ， 例 如 矢量 处 理 器 、 神 经 处 理 器 和 脉动 处 理 器 等 。 还 有 许多 的 体系 结构 都 可 以 执行 多 
重 或 并 行 处 理 ， 所 有 的 MIMD 机 器 都 具有 这 种 特性 。 非 常 重要 的 一 点 是 ， 要 注意 “并 行 ”有 多 种 不 同 
的 意义 。 而 且 ， 区 分 不 同 的 意义 也 同样 非常 重要 。 

本 节 先 讨论 ILP 体系 结构 的 一 个 例子 ， 然 后 将 讨论 有 关 SIMD 和 MIMD 体系 结构 的 内 容 。 最 后 部 
分 将 引信 一 些 新 〈 非 主流 ) 的 并 行 处 理 方法 ， 包 括 脉动 阵列 、 神 经 网 络 和 数据 流 计算 。 


9.4.1 超标 量 和 VLIW 体系 结构 


本 部 分 我 们 会 重新 回顾 超标 量 体 系 结构 ， 并 将 它们 与 VLIW 体系 结构 进行 比较 。 超 标量 体系 结构 
和 VLIW 体系 结构 都 属于 指令 级 的 并 行 执行 ， 但 它们 在 处 理 方法 上 有 区 别 。 为 了 使 下 面 的 讨论 有 一 个 
很 好 的 基础 ， 我 们 首先 从 超 流水 线 的 定义 开始 。 大 家 还 记得 ， 在 流水 线 操 作 中 ， 将 取 指 -解码 -执行 周 
期 分 成 不 同步 又 〈 或 阶段 ) 。 在 同一 个 时 间 内 ， 我 们 会 把 一 组 指令 分 配 到 不 同 的 步骤 中 。 一 个 最 理想 的 
情形 应 该 是 ， 每 个 时 钟 周 期 都 会 有 一 条 指令 从 流水 管道 中 移出 来 。 但 是 ， 由 于 代码 存在 分 支 转移 指令 
以 及 数据 的 相互 依赖 性 ， 所 以 每 个 时 钟 周 期 都 有 一 条 指令 输出 的 目标 不 可 能 达到 的 。 

当 一 个 流水 线 中 的 步骤 的 执行 只 要 求 少 于 半 个 时 钟 周 期 时 ， 就 会 发 生 超 流水 线 作 业 〈superpipelin- 
ing)。 这 时 ， 可 以 添加 一 个 内 部 时 钟 信 号 。 如 果 内 部 时 钟 以 两 倍 的 外 部 时 钟 的 速度 运行 时 ， 就 能 够 实现 
在 每 个 外 部 时 钟 周期 内 完成 两 个 任务 。 尽 管 超 流水 线 作 业 同 样 可 以 应 用 于 RISC 体系 结构 和 CISC 体系 结 
构 ， 但 是 在 大 多 数 情况 下 ， 超 流水 线 技 术 应 用 在 RISC 体系 结构 的 处 理 器 中 。 超 流水 线 作 业 是 超标 量 体 
系 结构 设计 的 一 个 方面 。 正 因为 此 原因 ， 人 们 常常 会 混淆 超 流水 线 和 超标 量 体 系 结构 这 两 个 概念 。 

所 以 ， 到 底 什么 是 一 个 超标 量 体 系 结构 的 处 理 器 ? 大 家 知道 Pentium 系列 处 理 器 是 一 个 超标 量 体 
系 结构 的 处 理 器 ， 但 是 目前 为 目 我 们 还 没有 讨论 超标 量 体 系 结构 的 真正 含义 。 超 标量 《superscalar) 
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是 一 种 允许 在 一 个 时 钟 周期 内 同时 执行 多 条 指令 的 设计 方法 。 尽 管 超标 量 体 系 结构 和 流水 线 作业 在 许 
多 方面 有 所 不 同 〈 在 下 面 将 要 简短 讨论 它们 的 区 别 )， 但 是 最 终 的 效果 却 是 相同 的 。 超 标量 体系 结构 的 
设计 中 获得 系统 加 速 的 方式 类 似 于 在 一 个 繁忙 的 单 通道 高 速 公路 增加 另 一 条 通道 。 这 种 方法 需要 增加 
额外 的 “硬件 ”， 但 最 后 ， 可 以 有 更 多 的 汽车 (或 指令 ) 能 够 在 相同 的 时 间 内 从 A 点 到 达 B 点 。 

类 似 于 额外 的 高 速 公路 车 道 的 超标 量 部 件 被 称 为 执行 单元 (execution units)。 执 行 单元 包括 浮 点 
加 法 器 和 乘法 器 ， 整 数 加 法 器 和 乘法 器 ， 以 及 其 他 一 些 专用 的 部 件 。 虽 然 这 些 单元 同样 也 可 以 独立 地 
工作 ， 但 是 非常 重要 的 一 点 是 ， 这 种 超标 量 体 系 结构 中 有 足够 多 数量 的 专用 单元 并 行 地 处 理 多 条 指令 。 
在 这 里 ， 重 复 的 执行 单元 是 很 常见 的 。 例 如 ， 一 个 超标 量 的 系统 可 以 有 一 对 完全 相同 的 浮 点 单元 。 通 
常 ， 执 行 单元 是 按 流水 技术 安排 的 ， 这 样 可 以 提供 更 好 的 性 能 。 

这 种 体系 结构 中 的 一 个 关键 部 件 是 有 一 个 特殊 的 取 指 单元 (instruction fetch unit) ， 它 可 以 从 存储 
器 中 同时 取出 多 条 指令 。 这 个 单元 依次 将 指令 传递 给 一 个 综合 译 码 单元 (decoding unit)， 以 确定 这 些 
指令 是 否 是 独立 的 〈 独 立 的 指令 可 以 同时 执行 )， 或 者 是 否 具有 某 种 类 型 的 相关 性 的 〈 在 这 种 情况 下 ， 
所 有 的 指令 不 能 同时 执行 ) 。 

作为 一 个 例子 ， 考 虑 IBM RS/6000 计算 机 。 这 种 处 理 器 有 一 个 取 指 令 单元 和 两 个 处 理 器 ， 每 个 处 
理 器 中 都 有 一 个 6 级 的 浮 点 单元 和 一 个 4 级 的 整数 单元 。 取 指令 单元 设置 成 两 级 流水 线 作 业 。 其 中 ， 
第 一 级 的 任务 是 每 次 提取 一 个 4 指令 的 指令 包 ， 第 二 级 则 是 将 这 些 指令 传送 到 合适 的 处 理 单元 上 。 

超标 量 计 算 机 是 一 种 通过 流水 线 作 业 和 单元 复制 来 实现 并 行 执行 的 体系 结构 。 超 标量 设计 中 包括 
超 流水 线 作业 ， 同 时 提取 多 条 指令 ， 一 个 能 够 确定 指令 相关 性 和 动态 地 组 合 指令 以 确保 没有 违反 相关 
性 的 综合 译 码 单元 ， 以 及 适合 于 多 条 指令 并 行 执行 所 需要 的 足够 多 数量 的 系统 资源 。 大 家 注意 到 ， 尽 
管 这 种 类 型 的 并 行 执行 机 制 需要 专门 的 硬件 设备 ， 但 超标 量 体 系 结构 同样 也 需要 一 个 复杂 精巧 的 编译 
器 来 完成 事务 的 调度 操作 ， 这 样 可 以 最 佳 地 利用 机 器 的 资源 。 

超标 量 处 理 器 同时 依赖 于 硬件 〈 对 相关 性 进行 仲裁 ) 和 编译 器 (产生 适当 的 事务 调度 )， 然 而 
VLIW 处 理 器 则 完全 依赖 于 编译 器 。VLIW 处 理 器 会 把 许多 独立 的 指令 包装 组 合成 一 条 长 指令 ， 这 条 
长 指令 会 依次 地 告诉 执行 单元 将 要 做 什么 。 有 许多 人 争辩 说 ， 由 于 编译 器 对 代码 中 的 各 种 相关 性 有 更 
好 的 全 局 观 (overall picture) ， 所 以 这 种 方法 可 以 产生 更 好 的 性 能 。 但 是 ， 由 于 编译 器 不 能 对 运行 时 间 
的 代码 有 一 个 全 局 观 ， 所 以 编译 器 在 调度 时 被 迫 趋向 保守 。 

当 一 个 VLIW 的 编译 器 创建 非常 长 的 指令 时 ， 同 样 也 要 对 所 有 指令 的 相关 性 进行 仲裁 。 这 种 长 指 
令 要 在 编译 时 才能 确定 ， 通 常 包 含 4 到 8 条 程序 指令 。 因 为 这 些 长 指令 被 固定 后 ， 任 何 可 能 会 影响 指 
令 的 事务 调度 的 修改 工作 (例如 改变 存储 器 的 等 待 时 间 )， 都 需要 对 该 代码 进行 重新 编译 ， 这 显然 也 给 
软件 供应 商 带 来 大 量 潜在 的 问题 。VLIW 体系 结构 的 支持 者 指出 了 这 种 技术 可 以 通过 把 复杂 性 问题 转 
移 给 编译 器 从 而 达到 实现 简化 硬件 的 目的 。 而 超标 量 体 系 结构 的 支持 者 则 反驳 说 ,虽然 VLIW 可 能 简 
化 硬件 ， 但 是 却 会 大 大 地 增加 了 所 生成 的 代码 数量 。 例 如 ， 如 果 不 使 用 程序 控制 域 ， 那 么 浪费 了 存储 
器 空间 和 带宽 。 事 实 上 ， 一 个 典型 的 FORTRAN 程序 ， 在 VLIW 机 器 上 编译 时 会 扩大 到 正常 规模 的 2 
倍 ， 有 时 其 至 是 3 售 。 

Intel 公司 的 Itanium IA-64 处 理 器 是 VLIW 处 理 器 的 一 个 例子 。 大 家 记得 ，IA-64 使 用 的 是 一 个 
EPIC 类 型 的 VLIW 处 理 器 。EPIC 体系 结构 与 普通 的 VLIW 处 理 器 相 比 有 很 多 优点 。 像 VLIW 一 样 ， 
EPIC 体系 结构 也 会 捆绑 指令 ， 以 便 传送 到 不 同 的 执行 单元 。 但 是 , 与 VLIW 的 区 别 在 于 ，EPIC 捆绑 
的 指令 包 不 需要 具有 相同 的 长 度 。 利 用 一 个 特定 的 分 隔 符 来 指示 一 个 指令 捆绑 的 结束 和 下 一 个 指令 搁 
绑 的 开始 。EPIC 通过 硬件 对 指令 字 进 行 预 取 ， 并 识别 指令 ， 然 后 对 独立 的 指令 捆绑 包 进 行事 务 调度 以 
便 并 行 执行 。 这 是 希望 克服 由 于 编译 器 缺少 对 运行 时 间 代 码 的 全 局 观 所 带 来 的 各 种 限制 的 一 种 尝试 方 
法 。 在 捆绑 包 中 的 各 条 指令 都 没有 涉及 到 相关 性 ， 这 样 就 可 以 对 这 些 指 令 并 行 执行 ， 而 无 需 考 虑 指令 
的 顺序 。 大 多 数 人 都 认为 ，EPIC 其 实 就 是 VLIW。 尽 管 Intel 公司 在 这 一 点 上 不 这 样 认 为 ,一些 奖 固 
的 结构 设计 师 也 会 引用 上 面 所 提 及 的 一 些微 小 区 别 (还 有 其 他 的 几 个 微小 区 别 ) 来 争辩 ， 但 是 实际 上 





可 选 树 的 体系 结 槐 293 








EPIC 只 不 过 是 VLIW 的 一 个 升级 版 本 。 
9.4.2 矢量 处 理 器 


矢量 处 理 器 (vector processors) 通常 被 称 为 超级 计算 机 。 矢 量 处 理 器 是 专门 设计 的 高 度 流水 线 作 
业 的 处 理 器 。 矢 量 处 理 器 能 够 对 整个 矢量 和 矩阵 上 行 高 效率 的 操作 。 这 类 处 理 器 非常 适合 于 能 从 高 度 
并 行 执行 中 受益 的 应 用 程序 ， 例 如 天 气 预 报 、 医 学 诊断 和 图 形 处 理 等 。 

为 了 理解 矢量 处 理 ， 首 先 必须 了 解 矢量 的 算法 。 矢 量 是 一 个 确定 长 度 的 一 维 的 数值 排列 ， 或 者 是 
一 个 有 序 的 标量 序列 。 对 于 矢量 ， 我 们 定义 了 各 种 不 同 的 算术 运算 ， 包 括 加 法 、 减 法 和 乘法 运算 。 

矢量 计算 机 属于 高 度 流水 线 作业 ， 所 以 各 种 算术 运算 之 间 可 以 重合 。 每 条 指令 都 指定 了 一 组 对 整 
个 矢量 所 执行 运算 的 集合 。 例 如 ， 要 把 矢量 vi 和 v2 相 加 ， 并 将 结果 送 入 V3。 在 一 个 传统 的 处 理 器 
上 ， 运 算 的 代码 将 会 包含 如 下 循环 : 


for i = 0 to VectorLength 
V3[il 一 Vi + V2[i]; 


然而 ， 在 一 个 矢量 处 理 器 中 ， 代 码 就 变 成 了 ， 


LDV V1，R1 :load vectorl into vector register Rl 
LDV V2, R2 

ADDV R3, Rl1l, R2 

STV R3, V3 ;store vector register R3 in vector V3 


矢量 寄存 器 (vector register) 是 一 种 可 以 一 次 保存 多 个 向 量 元 素 专 用 的 寄存 器 。 它 每 次 发 送 一 个 元 素 到 
矢量 流水 线 。 来 自流 水 线 输出 的 结果 也 是 每 次 传送 一 个 元 素 回 到 矢量 寄存 器 中 。 因 此 ， 这 些 寄存 器 是 能 够 保 
存 许多 值 的 先进 先 出 (FIFO〉 的 队列 寄存 器 。 通 常 ， 矢 量 处 理 器 中 有 多 个 这 样 的 寄存 器 。 矢 量 处 理 器 的 指 
令 集 中 包括 装载 寄存 器 ， 对 寄存 器 中 的 元 素 执 行 操作 ， 以 及 将 矢量 数据 存 回 到 存储 器 等 指令 。 

矢量 处 理 器 通常 可 以 按照 指令 如 何 访问 操作 数 分 为 两 类 。 寄 存 器 -寄存 器 矢量 处 理 器 (register-reg- 
ister vector processor) 要 求 所 有 的 操作 都 使 用 寄存 器 作为 源 操作 数 和 目标 操作 数 。 存 储 器 -存储 器 矢量 
处 理 器 (memory-memory vector processor) 允许 操作 数 从 内 存 直 接 传送 到 算术 单元 。 随 后 ， 操 作 结 果 
又 被 传送 存 回 到 存储 器 。 寄 存 器 -寄存 器 类 型 的 处 理 器 的 缺点 就 是 长 矢量 必须 被 拆 分 为 确定 长 度 的 片 
断 ， 而 且 这 些 片 断 还 必须 小 到 可 以 存放 到 寄存 器 中 。 然 而 ， 存 储 器 -存储 器 类 型 的 机 器 也 由 于 有 存储 器 
的 延迟 ， 因 而 有 一 个 较 长 的 启动 时 间 。 启 动 时 间 是 指 从 初始 化 指令 开始 到 指令 执行 的 第 一 个 结果 从 流 
水 线 出 现 所 需要 的 时 间 。 然 而 ， 在 流水 线 充满 时 ， 这 个 缺点 就 消失 了 。 

矢量 指令 之 所 以 效率 高 有 两 个 原因 。 首 先 ， 机 器 每 次 提取 较 少 的 指令 ， 这 就 意味 着 译 码 的 工作 量 、 
控制 单元 的 费用 和 内 存 带 宽 的 使 用 率 都 会 大 大 减少 。 其 次 ， 处 理 器 知道 它 会 有 一 个 连续 的 数据 来 源 ， 
并 且 可 以 预 取出 相对 应 的 数据 值 。 如 果 使 用 交叉 存储 的 内 存 ， 那 么 每 个 时 钟 周期 可 以 到 达 一 个 数据 对 。 
最 著名 的 矢量 处 理 器 是 Cray 系列 的 超级 计算 机 。 在 过 去 的 25 年 中 ， 它 的 基本 体系 结构 很 少 有 所 改变 。 


9.4.3 互连网 络 


在 并 行 执行 的 MIMD 系统 中 ， 为 了 实现 同步 处 理 和 数据 共享 ， 处 理 器 披 此 之 间 通 信和 是 必 不 可 少 
的 。 消 息 在 系统 组 件 中 的 传输 方式 决定 了 整个 系统 的 设计 。 消 息 传输 方式 有 两 种 : 使 用 共享 存储 器 ， 
或 者 是 采用 一 个 互连网 络 模型 。 共 享 存储 器 的 系统 有 一 个 能 够 被 所 有 的 处 理 器 进行 同等 访问 的 大 存储 
器 。 在 互连网 络 的 系统 中 ， 每 个 处 理 器 都 有 自己 的 存储 器 ， 但 是 允许 处 理 器 通过 网 络 访问 其 他 处 理 器 
的 存储 器 。 当 然 ， 这 两 种 方式 都 有 它们 的 优 缺 点 。 

互连网 络 通常 按照 拓扑 结构 、 路 由 策略 和 交换 技术 进行 分 类 。 网 络 拓扑 〈topology)， 也 就 是 各 个 
组 件 互 连 的 方式 ， 是 在 信息 传递 中 影响 管理 费用 的 一 个 主要 的 决定 性 因素 。 消 息 传递 的 效率 受到 下 列 
因素 的 限制 : 
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“带宽 〈bandwidth) 一 一 网 络 传递 消息 的 容量 

* 消息 延迟 (message latency) 一 一 一 条 消息 的 第 一 个 位 到 达 日 的 地 所 需要 的 时 间 

， 传 输 延 迟 (transport latency) 一 一 在 网 络 上 传输 消息 所 花费 的 时 间 

。 开销 (overhead) 一 一 消息 发 送 者 和 接收 者 的 消息 处 理 活 动 

相应 地 ， 网 络 设计 的 原则 总 是 努力 使 所 要 传输 的 消息 量 和 消息 所 必须 经 过 的 传输 距离 减 至 最 小 。 

互连网 络 既 可 以 是 静态 (static) 网 络 ， 也 可 以 是 动态 (dynamic) 网 络 。 动 态 网 络 允 许 两 个 实 
体 〈 两 个 处 理 器 或 者 一 个 处 理 器 和 一 个 存储 器 ) 之 间 的 路 径 可 以 从 一 次 通信 到 下 一 次 通信 时 发 生 
改变 ， 而 静态 网 络 却 不 能 。 互 联网 络 还 可 以 是 阻塞 型 (blocking) 网 络 或 者 非 阻塞 型 (nonblock- 
ing) 网 络 。 非 阻塞 型 网 络 允 许 有 其 他 同时 发 生 的 连接 存在 的 情况 下 建立 新 的 连接 ， 而 阻塞 型 网 络 
却 不 能 如 此 。 

静态 互连网 络 主要 用 来 传递 信息 和 各 种 类 型 的 服务 ， 这 其 中 很 多 服务 类 型 都 是 我 们 所 熟悉 的 。 处 
理 器 之 间 通 常 采 用 静态 网 络 进行 互 连 ， 而 处 理 器 -存储 器 对 之 间 一 般 采 用 动态 网 络 连接 。 

完全 连接 网 络 (completely connected networks) 是 指 网 络 中 的 所 有 组 件 都 相互 连接 在 一 起 的 网 络 。 
建立 完全 连接 网 络 的 费用 非常 昂贵 ， 而 且 当 有 新 实体 要 加 和 人 到 网 络 时 ， 很 难 管理 网 络 。 星 型 网 络 
(star-connected networks) 有 一 个 中 央 集 线 器 ， 所 有 消息 都 必须 通过 中 央 集 线 器 进行 传递 。 尽 管 集 线 
器 可 能 会 是 一 个 中 央 的 瓶颈 ， 但 是 集线器 可 以 提供 出 色 的 连通 性 。 线 性 阵列 (linear array) 或 环形 网 


络 (ring networks) 都 允许 任意 一 个 实体 同 它 的 两 
个 邻居 实体 直接 相连 ， 但 是 任何 一 个 非 邻 居间 的 通 -水 
a) 完全 网 络 b) 星 型 网 络 








~ 






wa 人 
CA 


信和 都 需要 穿越 多 个 实体 才能 到 达 目 的 地 。 环 形 连 接 
是 线性 阵列 的 一 个 变 体 ， 我 们 只 需要 把 线性 阵列 的 
首尾 两 个 实体 直接 相连 即 可 。 网 状 网 络 (mesh net- 


works) 是 把 每 一 个 实体 与 4 或 6 个 邻居 实体 相连 
接 ， 其 中 连接 实体 的 个 数 取 决 于 是 二 维 网 络 还 是 三 ”6-0-0-0 
维 网 络 。 这 种 网 络 的 扩展 可 以 进行 环绕 连接 ,非常 ”mo 


类 似 于 一 个 线性 网 络 环绕 连接 构成 一 个 环形 网 络 。 
树 形 网 络 (tree networks) 是 将 实体 排列 成 非 c) 线性 和 环形 网 络 由 网 状 和 网 状 环形 网 络 


循环 结构 ， 但 是 在 树 的 根部 会 形成 了 一 个 潜在 的 通 gx 
信 瓶 颈 。 超 立方 体 网 络 (hypercube) 是 网 状 网 络 的 
多 维 扩 展 。 在 超 立方 体 网 络 中 每 一 维 都 有 两 个 处 理 


器 〈 超 立方 体 网 络 通常 用 来 连接 处 理 器 ， 而 不 是 连 5 树 形 网 络 全 三 维 超 立方 体 网 络 
接 处 理 器 -存储 器 的 集合 )。 二 维 的 超 立方 体 网 络 由 图 9-3 部 态 网 络 拓扑 图 
通过 一 个 直接 链接 进行 连接 的 处 理 器 对 组 成 ， 这 些 
互 连 处 理 器 的 标号 的 二 进 制 表示 严格 说 来 必须 有 一 个 数位 ， 而 且 也 只 能 有 一 个 数位 不 同 。 在 一 个 
维 的 超 立 方 体 网 络 结 构 中 ， 每 一 个 处 理 器 都 直接 与 4 个 其 他 处 理 器 相连 接 。 有 趣 的 是 ， 我 们 将 一 个 
超 立 方 体 结构 网 络 的 两 个 处 理 器 标号 中 不 相同 的 数位 位 置 的 总 数 称 为 海 明 距离 (Hamming distance)， 
海 明 距 离 同 样 也 用 来 表示 两 个 处 理 器 之 间 的 最 短路 径 的 通信 连接 数目 。 @ 。 
图 9-3 表 示 不 同类 型 的 静态 网 络 。 

动态 网 络 是 采用 下 面 两 种 方式 之 一 对 网 络 实施 动态 配制 : 或 者 使 用 总 总 线 
线 ， 或 者 使 用 一 个 交换 开关 可 以 改变 通过 网 络 的 路 由 。 适 中 的 实体 数目 和 了 了 
成 本 是 网 络 构建 中 主要 考虑 的 因素 ， 基 于 总 线 的 网 络 (bus-based net- 
works) 是 最 简单 和 最 有 效 的 ， 如 图 9-4 所 示 。 显 然 ， 这 种 方式 的 最 大 缺点 图 94 一 种 基于 总 线 
是 当 总 线 上 连接 的 实体 数目 变 得 很 大 时 所 产生 的 瓶颈 问题 。 并 行 总 线 可 以 的 网 络 
减轻 这 个 瓶颈 问题 ， 但 是 需要 花费 的 代价 也 是 相当 大 的 。 
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交换 网 络 使 用 开关 来 动态 地 改变 网 络 的 路 由 。 这 里 有 两 种 类 型 的 开关 : 交叉 开关 和 2X2 开关 。 交 
又 开关 (或 纵横 开关 ，crossbar switch) 就 是 简 
单 的 开关 ， 只 有 打开 或 关闭 两 种 功能 。 通 过 闭 
合 开 关 就 可 以 实现 任意 两 个 实体 之 间 的 连接 ， 
即 产 生 一 个 连接 。 由 交叉 开关 所 组 成 的 网 络 属 
于 完全 连接 的 网 络 ， 因 为 所 有 的 实体 都 能 够 直 
接 与 其 他 实体 进行 连接 ， 并 且 人 允许 在 不 同 的 处 
理 器 和 存储 器 对 之 间 同 时 进行 通信 。 但 是 ,一 
个 特定 的 处 理 器 一 次 至 多 只 能 有 一 个 连接 。 而 图 9-5 交叉 式 网 络 
开关 断 开 就 可 以 阻止 消息 的 传输 。 因 此 ， 交 叉 式 网 络 是 一 种 非 阻塞 型 网 络 。 然 而 ， 如 果 在 每 一 个 
交叉 点 需要 有 一 个 单独 的 开关 ， 那么 个 实体 就 需要 有 ?2 个 开关 。 实 际 上 ， 许 多 多 处 理 器 都 要 求 
在 一 个 交叉 点 上 有 许多 开关 。 这 样 一 来 ， 管 理 大 量 开 关 的 任务 即刻 就 变 得 非常 困难 和 代价 很 高 。 
交叉 开关 实际 上 只 适用 于 高 速 多 处 理 器 的 矢量 计算 机 中 。 图 9-5 给 出 了 一 个 交叉 开关 的 网 络 配置 。 
图 中 的 蓝 色 开关 代表 闭合 开关 。 一 个 处 理 器 一 次 只 能 连接 一 个 存储 器 ， 所 以 图 中 的 每 一 列 中 最 多 
只 能 有 一 个 开关 闭合 。 

第 二 种 类 型 的 开关 是 2X2 开关 。2X2 开关 和 交叉 开关 非常 相似 ， 但 是 交叉 开关 只 能 简单 打开 或 
者 关闭 通信 信道 ， 而 2X2 开关 可 以 将 它 的 输入 端 连接 到 不 同 
的 目的 端 。 一 个 2X2 交换 开关 有 两 个 输入 端 和 两 个 输出 由。 一 国 国 一 一重 国 一 


在 任意 时 刻 ， 一 个 2X 2 的 开关 可 以 处 于 下 列 的 4 种 状态 之 。 中 通过 ps 
一 : 通过 (through)、 交 又 (cross)、 上 部 广播 (upper 一 - 枚 加 一 一 -全 可 一 
ro 
入 端 也 连接 到 下 部 的 输出 端 。 更 简单 地 说 ， 输 入 是 直接 通过 。 国 ”5 2?X2 交换 开关 的 各 种 可 能 状态 
开关 的 。 在 交叉 状态 ， 上 部 的 输入 端 连接 到 下 部 的 输出 端 ， 而 下 部 的 输入 端 连接 到 上 部 的 输出 端 。 在 
上 部 广播 中 ， 上 部 的 输入 同时 广播 到 上 部 输出 和 下 部 输出 。 在 下 部 广播 中 ， 下 部 的 输入 同时 广播 到 上 
部 输出 和 下 部 的 输出 。 通 过 状态 和 交叉 状态 是 与 互连网 络 相关 的 两 种 状态 。 

目前 ， 最 先进 的 网 络 类 型 ， 多 级 互连网 络 (multistage interconnection networks) 就 是 利用 2X2 
开关 构建 的 。 这 种 网 络 的 基本 思想 是 使 用 多 极 开关 的 组 合 ， 通 常 是 将 处 理 器 放 在 开关 的 一 边 ， 而 把 存 
储 器 放 在 开关 的 另外 一 边 。 并 且 利 用 一 系列 开关 元 素 作为 网 络 内 部 节点 。 这 些 开关 会 动态 地 配置 自己 ， 
可 以 在 指定 的 处 理 器 和 指定 的 存储 器 之 间 构 建 一 条 通路 。 所 使 用 的 开关 的 数目 和 开关 的 级 数 对 每 一 条 
通信 信道 的 路 径 长 度 都 有 贡献 。 当 由 开关 决定 把 某 个 信息 从 特定 的 源 地 址 传送 到 指定 的 目的 地 所 要 求 
的 配置 时 ， 可 能 会 发 生 轻微 的 延迟 。 这 种 多 级 网 络 通常 称 为 洗 牌 网 络 (shuffle networks)， 这 种 说 法 暗 
示 了 开关 之 间 的 连接 模式 。 

许多 的 拓扑 结构 适合 在 多 级 交换 网 络 中 使 用 。 这 些 多 级 交换 网 i ep 
络 可 以 在 松散 耦合 的 分 布 式 系统 中 用 于 各 个 处 理 器 之 间 的 连接 ， 也 开关 
可 以 使 用 在 紧密 耦合 的 系统 中 用 来 控制 处 理 器 到 存储 器 的 通信 。 一 
个 开关 在 某 个 时 间 只 能 处 在 一 种 状态 ， 所 以 很 显然 可 能 会 发 生 阻 塞 
现象 。 例 如 ， 考 虑 这 类 网 络 的 一 个 简单 的 拓扑 结构 ， 如 图 9-7 所 示 
的 欧米 伽 网 络 (Omega networks) 。 如 果 将 开关 1A 和 开关 2A 都 设 | 





置 成 通过 状态 ，CPU 00 和 存储 器 模块 00 之 间 就 可 能 进行 通信 。 但 WU 
是 与 此 同时 ， 在 CPU 10 和 存储 器 模块 01 之 间 不 可 能 进行 通信 。 因 和 

此 ， 开 关 1A 和 开关 2A 都 必须 要 设置 成 交叉 状态 ， 这 样 CPU 10 和 图 97 一 个 二 级 的 Omega 网 络 
存储 器 模块 01 之 间 才 可 以 进行 通信 。 因 此 ， 这 种 Omega 网 络 是 一 个 阻塞 型 网 络 。 通 过 增加 更 多 的 开 
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关 数 目 和 更 多 的 开关 级 数 可 以 构建 非 阻塞 型 的 多 级 网 络 。 一 般 来 说 ， 一 个 节点 的 Omega 网 络 需要 有 
logsn 级 开关 和 每 一 级 有 n/2 个 开关 。 

今 人 感 兴趣 的 是 ， 配 置 这 些 开关 实际 上 并 没有 看 起 来 那么 困难 。 当 在 网 络 上 传输 消息 时 ， 传 输 的 
目的 模块 的 二 进 制 表示 可 以 用 来 对 这 些 开关 进行 编程 控制 。 对 于 多 极 网 络 的 每 一 级 都 使 用 目的 地 址 的 
一 位 ， 革 于 这 个 位 的 值 对 每 个 开关 进行 编程 。 如 果 这 个 位 是 0， 就 把 输入 连接 到 上 部 输出 。 如 果 这 个 
位 是 一 个 1， 就 把 输入 连接 到 下 部 输出 。 例 如 ， 假 设 CPU 00 希望 与 存储 器 模块 01 进行 通信 。 则 可 以 
使 用 目的 地 址 的 第 一 位 〈0) 将 开关 1A 设置 成 通过 状态 ( 即 把 输入 连接 到 上 部 输出 )， 使 用 第 二 位 
(1) 将 开关 2A 设置 成 交叉 状态 〈 即 把 输入 连接 到 下 部 输出 ) 。 如 果 CPU 11 希望 与 存储 器 模块 00 进行 
通信 ， 则 将 开关 1B 和 开关 2A 都 设置 成 交叉 状态 〈 因 为 这 两 个 输入 都 必须 连接 到 上 部 输出 )。 

另 一 种 确定 开关 设置 的 方法 是 比较 源 地 址 和 目的 地 址 的 对 应 位 。 如 果 这 些 位 相同 ， 就 把 开关 设置 
成 通过 状态 。 如 果 这 些 位 不 同 ， 则 将 开关 设置 成 交叉 状态 。 例 如 ， 假 设 CPU 00 希望 与 存储 器 模块 0 
进行 通信 。 则 可 以 比较 两 个 对 象 的 第 一 位 《0 和 0)， 把 开关 1A 设置 成 通过 状态 。 并 比较 它们 的 第 二 位 
(0 和 1)， 然 后 把 开关 2A 设置 成 交叉 状态 。 

互 连 处 理 器 的 各 种 方法 都 有 其 优 缺 点 。 例 表 9-2 ,各 种 不 同 的 互连网 络 的 特性 比 六 
如 ， 当 只 有 中 等 规模 数量 的 处 理 器 时 ， 基 于 总 线 
的 网 络 是 最 简单 也 是 效率 最 高 的 互联 解决 方法 。 
然而 ， 当 有 许多 处 理 器 都 同时 请 求 访问 存储 器 
时 ， 总 线 就 会 变 成 传输 的 瓶颈 。 表 9-2 给 出 了 基 
于 总 线 的 网 络 。 交 叉 开 关 网 络 和 多 级 互联 网 络 的 
特性 比较 。 





























9. 4. 4 共享 存储 器 的 多 处 理 器 


前 面 曾 提 过 ， 多 处 理 器 可 以 按照 存储 器 的 组 织 方式 进行 分 类 。 紧 密 耦 合式 系统 使 用 相同 的 存储 器 ， 
称 为 共享 存储 器 的 处 理 器 (shared memory processors) 。 但 是 这 并 不 意味 着 所 有 的 处 理 器 都 必须 共享 一 
个 很 大 的 存储 器 。 每 个 处 理 器 都 可 以 有 一 个 局 部 存储 器 ， 而 且 这 个 局 部 存储 器 必须 可 以 被 其 他 处 理 器 
共享 。 同 样 ， 也 可 以 让 每 个 处 理 器 都 拥有 一 个 局 部 高 速 缓存 和 一 个 单一 的 全 局 存储 器 。 图 9-8 说 明了 
上 述 的 这 三 种 观点 。 

共享 存储 器 的 多 处 理 器 (SMM) 的 概念 可 以 追溯 到 20 世纪 70 年 代 。 当 时 ，Carnegie-Mellon 大 学 
使 用 交叉 开关 将 16 个 处 理 器 和 16 个 存储 器 模块 连接 起 来 构建 了 世界 上 第 一 台 SMM 机 器 。 早 期 受到 
人 们 广泛 称赞 的 SMM 机 器 是 由 16 个 PDP-11 处 理 器 和 16 个 存储 器 仓库 组 成 的 cm* 系 统 ， 所 有 的 这 些 
组 件 都 利用 一 个 树 形 网 络 连接 。 在 所 有 的 处 理 器 中 均等 划分 系统 中 的 全 局 共享 存储 器 。 如 果 某 个 处 理 
器 生成 了 一 个 地 址 ， 那 么 处 理 器 会 首先 检查 其 局 部 存储 器 。 如 果 在 局 部 存储 器 中 没有 找到 这 个 地 址 ， 
就 将 这 个 地 址 传送 到 控制 器 。 然 后 ， 控 制 器 将 在 占据 子 树 的 处 理 器 中 尝试 查找 该 地 址 。 对 于 子 树 而 言 ， 
该 处 理 器 就 是 根 。 如 果 所 请 求 的 地 址 还 是 没有 找到 ， 那么 这 个 请 求 将 被 传送 到 树 的 上 层 直 到 找到 该 数 
据 为 止 ， 或 者 系统 到 其 他 地 方 查找 。 

市 场 上 已 经 有 了 一 些 商业 SMM 系统 ， 但 这 些 机 器 并 不 是 特别 流行 。 其 中 一 个 最 早 的 商业 SMM 
计算 机 是 BBN “(Bolt、Beranek 和 Newman) 公司 的 Butterfly。 这 台 计 算 机 使 用 了 256 个 Motorola 公 
司 68 000 处 理 器 。 最 近 ， 市 场 上 可 以 购买 到 KSR-1 (来 自 Kendall Square Research) 系统 ， 这 种 系统 将 
会 被 证 明 对 于 计算 科学 应 几 程 序 非常 有 用 。 每 个 KSR-1 的 处 理 器 都 包括 一 个 高 速 缓存 ， 但 是 这 个 系统 
没有 主 存储 器 。 系 统 是 通过 保持 在 每 个 处 理 器 中 的 高 速 缓存 目录 来 对 数据 进行 访问 。KSR-1 中 的 处 理 
单元 是 采用 一 个 单 向 环形 拓扑 结构 来 进行 连接 的 ， 如 图 9-9 所 示 。 消息 和 数据 只 能 在 环 上 进行 单 向 传 
输 。 每 个 一 级 环 可 以 连接 8 到 32 个 处 理 器 。 一 个 二 级 环形 结构 最 多 可 以 连接 34 个 一 级 环 ， 也 就 是 最 
大 可 以 连接 1088 个 处 理 器 。 假 如 某 个 处 理 器 需要 引用 一 个 位 于 地 址 z 处 的 数据 项 时 ， 则 包含 地 址 z 的 
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a) 全 局 共享 存储 器 b) 分 布 式 共享 存储 器 


9) 全 局 共享 存储 器 和 带 有 独立 的 高 速 缓存 的 处 理 大 
图 9-8 共享 存储 器 


处 理 器 高 速 缓存 就 会 把 这 个 请 求 的 高 速 缓存 块 放 到 连接 环 上 。 其 入 口 条 目 (包含 这 个 请 求 的 数据 ) 将 
沿 着 环 发 生 迁 移 ， 直 到 到 达 发 出 请 求 的 处 理 器 为 止 。 这 种 类 型 的 分 布 式 共享 存储 器 系统 称 为 共享 虚拟 
存储 器 系统 (shared virtual memory systems) 。 








9-9 ”KSR-1 环形 拓扑 的 层次 结构 
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按照 存储 器 操作 的 同步 方式 ， 我 们 可 以 把 共享 存储 器 的 MIMD 机 器 分 成 两 类 。 在 均匀 存储 器 访问 
(Uniform Memory Access，UMA) 的 系统 中 ， 所 有 的 存储 器 访问 都 花费 相同 的 时 间 。 一 台 UMA 机 器 
有 一 个 共享 的 存储 器 池 ， 它 通过 一 条 总 线 或 一 个 开关 网 络 与 一 组 处 理 器 相连 接 。 按 照 已 经 建立 的 互 连 
网 际 协议 ， 所 有 的 处 理 器 都 能 均等 地 访问 存储 器 。 当 处 理 器 数目 ”增加 时 ， 在 一 个 UMA 机 器 上 的 开 
关 互连网 络 〈 需 要 有 2" 个 连接 ) 很 快 就 变 得 非常 昂贵 。 基 于 总 线 的 UMA 系统 ， 在 当 总 线 的 带宽 不 足 
以 满足 系统 中 的 处 理 器 数目 要 求 时 ， 就 会 变 得 饱和 。 而 多 级 网 络 在 处 理 器 的 数目 变 得 非常 大 时 ， 也 会 
遭 到 物理 连 线 上 的 限制 和 时 间 上 的 重大 延迟 。 因 此 ，UMA 机 器 的 可 扩展 性 受到 了 互连网 络 特性 的 制 
约 。 对 称 多 处 理 器 是 著名 的 UMA 体系 结构 。UMA 计算 机 的 一 些 特殊 例子 包括 : Sun 的 超级 企业 服务 
器 、IBM 的 1 系列 和 p 系列 服务 器 ，HP 的 900 服务 器 和 DEC Alpha 服务 器 。 

为 了 解决 UMA 体系 结构 中 的 一 些 固 有 的 内 在 问题 ， 非 均匀 存储 器 访问 (nonuniform memory access， 
NUMA) 的 计算 机 为 每 个 处 理 器 都 提供 一 个 自己 的 存储 器 块 。 系 统 的 存储 器 空间 被 分 配 到 所 有 的 处 理 器 
上 ， 但 是 这 些 处 理 器 都 会 把 这 个 存储 器 看 作 一 个 连续 编 址 的 实体 。 虽 然 NUMA 的 存储 器 构成 了 一 个 单 
一 编 址 的 实体 ， 但 是 这 个 实体 的 分 布 特征 并 不 是 完全 透明 的 。 读 取 距 离 较 近 的 存储 器 要 比 读 取 较 远 处 的 
存储 器 花费 更 少 的 时 间 。 因 此 ， 在 整个 机 器 的 地 址 空间 内 ， 存 储 器 的 访问 时 间 是 不 一 致 的 。NUMA 体系 
结构 的 实例 包括 Sequent 的 NUMA-Q 计算 机 和 Silicon Graphics 的 Origin2000 计算 机 。 

NUMA 机 器 容易 出 现 高 速 缓存 一 致 性 (cache coherence) 问题 。 为 了 减 小 存储 器 的 访问 时 间 ， 每 
一 个 NUMA 处 理 器 都 保持 一 个 专用 的 高 速 缓存 。 然 而 ， 当 某 个 处 理 器 修改 位 于 其 自己 的 局 部 高 速 组 
存 中 的 一 个 数据 时 ， 就 会 与 这 个 数据 的 其 他 副本 不 一 致 。 例 如 ， 假 设 处 理 器 A 和 处 理 器 B 在 其 自己 的 
高 速 缓存 存储 器 中 都 有 数据 元 素 z 的 拷贝 。 假 设 z 的 值 为 10。 如 果 处 理 器 A 把 x 设置 为 20， 处 理 器 B 
的 高 速 缓存 (仍旧 包含 二 个 数值 10) 中 就 有 一 个 旧 的 或 过 时 的 〈stale) z 值 。 这 种 数据 的 不 一 致 性 是 
不 允许 出 现 的， 因此 必须 提供 某 些 处 理 机 制 以 确保 高 速 缓存 的 一 致 性 。 我 们 可 以 利用 一 种 专门 设计 的 ， 
称 为 Snoopy cache controllers 的 硬件 单元 来 监视 整个 系统 中 的 所 有 高 速 缓存 。 这 种 窥视 高 速 缓存 控制 
器 会 执行 系统 的 高 速 缓存 一 致 性 协议 。 应 用 将 视 高 速 缓存 技术 并 维持 高 速 缓 存 一 致 性 的 NUMA 机 器 
.被 认为 是 高 速 缓存 一 致 性 的 NUMA (cache coherent NUMA，CC-NUMA) 体系 结构 。 

解决 高 速 缓存 一 致 性 问题 最 简单 的 方法 就 是 要 求 具 有 过 时 值 的 处 理 器 ， 或 者 从 高 速 缓存 中 将 过 时 
的 z 值 删除 ， 或 者 把 > 更 新 为 一 个 新 的 值 。 如 果 当 z 的 值 被 改变 后 就 立即 执行 上 述 操作 ， 那 么 这 种 系 
统 采用 了 一 种 写 通 〈write-through) 高 速 缓存 的 更 新 协议 ”使 用 这 种 方式 ， 数 据 会 被 同时 写 人 高 速 组 
存 和 存储 器 。 如 果 使 用 写 更 新 (write-through with update) 协议 ， 那 么 包含 x 的 新 值 消息 将 会 广播 到 
所 有 其 他 高 速 缓存 控制 器 中 ， 以 便 控 制 器 可 以 更 新 其 自己 的 高 速 缓存 。 如 果 使 用 写 无 效 (write- 
through with invaliqation》 协议 ， 那 么 广播 中 将 包含 一 个 消息 ， 要 求 所 有 的 高 速 缓存 控制 器 将 过 时 的 
值 从 它们 的 高 速 缓存 中 移 除 。 写 无 效 方式 只 是 在 第 一 次 更 新 x 时 使 用 网 络 ， 因 此 可 以 保持 总 线 通 信和 量 
较 轻 。 写 更 新 方式 让 所 有 高 速 缓存 都 保持 当前 的 值 ， 这 样 可 以 减 小 延迟 ， 但 是 却 增 加 了 总 线 的 通信 重 。 

保持 高 速 缓存 一 致 性 的 第 二 种 方法 是 使 用 回 写 (write-back〉 协议 ， 回 写 协议 在 进行 修改 时 只 改变 
高 速 缓存 中 的 数据 。 只 有 等 到 修改 过 的 高 速 缓存 块 必须 被 替换 时 才 将 它 写 人 主 存储 器 ， 否 则 不 修改 主 
存储 器 的 内 容 。 在 这 种 协议 下 ， 数 据 值 在 被 写 人 存储 器 之 前 先 按 正常 的 方式 读 取 ， 处 理 器 必须 在 得 到 
修改 数据 的 专 有 权 后 才能 执行 修改 任务 。 数 据 的 修改 是 通过 请 求 数据 的 所 有 权 来 实现 的 。 在 数据 的 所 
有 权 被 授予 后 ， 其 他 处 理 器 上 的 所 有 该 数据 副本 都 将 会 失效 。 如 果 其 他 处 理 器 希望 读 取 这 个 数据 ， 则 
都 必须 从 拥有 这 个 值 的 处 理 器 中 请 求 该 数据 。 随 后 ， 被 授予 所 有 权 的 处 理 器 会 放弃 它 的 所 有 权 ， 并 把 
这 个 当前 数据 传送 到 主 存储 器 中 。 


9. 4.5 分 布 式 计算 


分 布 式 计算 是 多 重 处 理 的 另外 一 种 形式 。 尽 管 分 布 式 计算 已 经 成 为 了 计算 科学 中 一 种 越 来 越 流行 
的 方式 ， 但 是 这 对 大 家 来 说 并 不 意味 着 有 什么 不 同 。 从 某 种 意义 上 来 说 ， 所 有 的 多 处 理 器 系统 同样 都 
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是 分 布 式 系统 ， 因 为 它们 都 是 把 要 处 理 的 工作 负荷 划分 到 一 组 处 理 器 ， 让 这 些 处 理 器 一 起 协作 来 解决 
一 个 问题 。 但 是 大 多 数 人 在 使 用 分 布 式 系统 (distributed 
system) 时 ， 通 常 指 一 种 松散 耦合 的 多 计算 机 系统 。 大 家 em 
记得 ， 多 处 理 器 可 以 使 用 局 部 总 线 进行 连接 (参见 图 9- 
8c)， 或 者 是 通过 网 络 来 进行 连接 ， 如 图 9-10 所 示 。 松 散 
耦合 的 分 布 式 计算 机 通过 网 络 在 处 理 器 之 间 进 行 通 信 。 

最 近 ， 人 们 正在 使 用 单独 的 微型 计算 机 和 工作 站 网 络 
CNOW) 来 进行 分 布 式 系统 的 实践 ， 这 种 分 布 式 计算 的 思 
想 也 得 到 了 实例 的 证 明 。 这 些 系统 可 以 让 那些 闲散 的 PC 
处 理 器 来 处 理 某 个 大 型 问题 中 的 一 个 很 小 的 部 分 。 最 近 ， 
人 们 通过 利用 数 千 台 个 人 计算 机 的 资源 解决 了 一 个 与 密码 
相关 的 问题 。 每 台 计算 机 都 通过 使 用 少数 几 个 的 可 能 的 消 
息 密码 来 实现 非常 复杂 的 密码 分 析 。 

位 于 美国 Berkeley 的 加 利 福 尼 亚 大 学 有 一 个 射电 天 文学 研究 小 组 ，SETI (寻找 外 星 生命 ，Search 
for Extra Terrestrial Intelligence)， 他 们 的 任务 就 是 分 析 来 自 射电 天 文 望远镜 的 数据 。 为 了 帮助 完成 这 
个 计划 ，PC 机 用 户 可 以 在 他 们 的 家 庭 计算 机 上 安装 一 个 SETI 屏幕 保护 程序 。 这 个 屏幕 保护 程序 会 在 
处 理 器 的 空闲 时 间 中 分 析 信号 数据 。SETI 是 一 个 NOW 体系 结构 。 这 个 计划 非常 成 功 ， 在 短 短 的 18 
个 月 中 就 积累 了 50 万 年 的 CPU 计算 时 间 。 

对 于 一 般 用 途 的 计算 工作 ， 在 分 布 式 系统 中 透明 性 的 概念 是 非常 重要 的 。 我 们 应 该 尽 可 能 地 隐藏 
掉 分 布 式 网 络 的 许多 细节 问题 。 而 且 ， 使 用 远程 系统 资源 应 该 像 使 用 本 地 系统 资源 一 样 轻 松 方便 。 

远程 过 程 调 用 (remote procedure calls，RPC) 扩展 了 分 布 式 计算 的 概念 ， 有 助 于 为 资源 共享 提供 
必要 的 透明 性 。 通 过 使 用 远程 过 程 调用 ， 一 台 计 算 机 可 以 通过 调用 一 个 过 程 来 使 用 另 一 台 计算 机 上 的 
可 用 资源 。 这 个 调用 的 过 程 本 身 驻 留 在 远程 的 机 器 上 ， 但 是 这 个 远程 调用 的 操作 类 似 于 在 本 地 调用 系 
统 内 部 的 一 个 过 程 调用 。 我 们 可 以 通过 微软 公司 的 分 布 式 组 件 对 象 模型 〈Distributed Component Ob- 
ject Model，DCOM)， 开 放 组 织 的 分 布 计算 机 环境 (Distributed Computing Environment，DCE)， 通 用 
对 人 象 请 求 代理 体系 结构 (C6mmon Object Request Broker Architecture，CORBA) 和 Java 的 远程 方法 
调用 (Remote Method Invocation，RMI) 来 实现 远程 过 程 调用 。 今 天 的 软件 设计 师 都 倾向 于 面向 对 象 
的 分 布 式 计算 的 观点 ， 这 也 就 使 得 DCOM、CORBA 和 RMI 变 得 流行 。 


9.5 新 的 并 行 处 理 方法 


各 种 计算 机 的 书籍 都 在 努力 地 介绍 一 些 特别 新 的 先进 的 计算 机 体系 结构 。 尽 管 我 们 不 能 在 这 个 简 
短 的 章节 里 讨论 所 有 这 些 体系 结构 ， 但 是 将 会 给 大 家 介绍 几 种 有 别 于 传统 的 冯 “ 诺 伊 曼 体系 结构 的 著 
名 计算 机 体系 结构 。 这 些 系统 采用 一 些 新 的 思考 方式 来 看 待 计算 机 和 计算 。 它 们 包括 数据 流 计算 、 神 
经 网 络 和 脉动 阵列 处 理 。 


9.5.1 数据 流 计算 


冯 “ 诺 伊 曼 机 器 所 使 用 的 是 按 顺 序 控制 的 流程 。 程 序 计 数 器 会 决定 要 执行 的 下 一 条 指令 。 在 这 里 ， 
数据 和 指令 是 分 离 的 。 如 果 程 序 计数 器 的 数值 按照 引用 一 个 数据 值 的 语句 的 输出 结果 发 生 了 变化 ， 则 
数据 是 改变 指令 执行 顺序 的 唯一 方法 。 

在 数据 流 (dataflow) 计算 中 ,程序 的 控制 直接 人 数据 流 计算 是 一 一 种 非常 简单 的 方 
式 : 当 执 行 中 需要 的 数据 可 用 时 ， 就 执行 一 条 指令 。 因 此 ,指令 的 实际 顺序 和 指令 最 终 执行 的 顺序 没有 
关系 。 执 行 流 完 全 由 数据 相关 性 决定 。 hres i tn 也 没有 控制 执行 流程 
的 程序 计数 器 。 数 据 连续 地 流动 ， 而 且 在 同一 时 间 适 用 于 多 条 指令 。 每 一 条 指令 都 被 认为 是 一 个 独立 的 


图 9-10 通过 网 络 连接 的 多 处 理 器 
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过 程 。 指 令 不 会 引用 存储 器 ， 相 反 ， 这 些 指令 会 引用 其 他 指令 。 数据 是 从 一 条 指令 传递 到 下 一 条 指令 。 

我 们 可 以 通过 分 析 数 据 流 图 (data flow graph) 来 理解 数据 流 计算 机 的 计算 顺序 。 在 数据 流 图 中 ， 
节点 代表 指令 ， 弧 形 指示 指令 之 间 的 数据 相关 性 。 数 据 以 数据 令 牌 (data tokens) 的 形式 在 数据 流 图 
上 流动 。 当 一 条 指令 拥有 所 需 的 全 部 数据 令 牌 时 ， 其 节点 就 会 激活 〈fire)， 数据 令 牌 将 会 通过 节点 。 
当 激 活 一 个 节点 时 ， 节 点 就 会 消耗 数据 令 牌 ， 执 行 所 要 求 的 操作 ， 并 且 将 作为 结果 的 数据 令 牌 放 到 一 
个 输出 弧 形 上 。 图 9-11 说 明了 这 种 思想 。 

图 9-11 中 的 数据 流 图 给 出 的 是 一 个 静态 数据 流 的 体系 结构 的 例子 。 在 这 种 静态 体系 结构 中 ， 令 牌 
以 一 种 分 级 流水 线 作 业 的 方式 在 数据 流 图 中 流动 。 而 在 一 个 动态 数 ”A B 4 
据 流 的 体系 结构 中 ， 令 牌 中 标记 有 上 下 文 〈 环 境 ) 信息 ， 而 且 会 被 
存储 到 一 个 存储 器 中 。 在 每 个 时 钟 周期 内 ， 都 会 搜索 存储 器 ， 查 找 D4 NN 


激活 节点 所 需要 的 一 组 令 牌 。 只 有 节点 在 同一 环境 (上 下 文 ) 中 找 


到 一 组 完整 的 输入 令 牌 时 ， 节 点 才 会 被 激活 。 mBN wh 
数据 流 机 器 的 程序 必须 用 为 这 种 体系 结构 专门 设计 的 语言 来 纺 

写 。 这 种 编程 语言 包括 VAL、Id、SISAL 和 LUCID。 数 据 流程 序 (A+B)*(B-4) 

的 编译 会 产生 一 个 类 似 于 图 9-11 中 所 示 的 数据 流 图 。 当 程序 执行 ”图 9.11 计算 N= (A+B)* 

时 ， 这 些 令 牌 将 沿 着 弧 形 向 前 传播 。 (B 一 4) 的 数据 流 图 


下 面 考虑 计算 N! 的 示例 代码 
(initial dl < mek < 
While j > 14do 

Newk< -k*]; 

New ”< “3 3 


return k) 


对 应 的 数据 流 图 如 图 9-12 所 示 。 其 中 有 N 和 1 两 个 值 ， 被 输入 到 数据 流 图 中 。NN 转变 成 令 牌 7 。 
当 j 与 1 进行 比较 时 ， 如 果 它 比 1 大， j 令 牌 就 可 以 
被 传输 通过 并 且 会 被 加 倍 复制 。 其 中 一 个 令 牌 的 副 
本 会 被 传递 通过 “一 1 节点 ”， 而 另外 的 一 个 副本 会 
传递 通过 乘法 节点 。 当 7 不 大 于 1 时 ,上 & 的 值 将 会 作 
为 程序 输出 结果 被 传递 通过 。 只 有 当 新 的 j 令 牌 和 
新 的 & 令 牌 两 个 都 可 用 时 ， 才 会 激活 乘法 节点 。 输 
入 NN 和 1 的 两 个 “面向 右边 (right facing)” 的 三 角 
形 是 “合并 ”的 节点 ,而 且 只 要 有 任何 一 个 输入 值 
可 用 时 ， 这 两 个 节点 都 会 激活 执行 操作 )。 一 旦 N 和 1 被 送 入 图 中 ， 他 们 将 会 被 “ 耗 尽 ”， 而 新 的 j 
值 和 新 的 & 值 将 引发 合并 节点 激活 。 

1977 年 ， 美国 Utah 大 学 的 Al Davis 建造 了 世界 上 第 一 台数 据 流 计算 机 。1979 年 ， 在 法 国 的 
CERT-ONERA 研发 了 第 一 个 多 处 理 器 的 数据 流 系统 (其 中 包含 32 个 处 理 器 ) 。 英 国 曼彻斯特 大 学 在 
1981 年 创建 了 第 一 台 加 标记 令 牌 (tagged-token) 的 数据 流 计算 机 。 具 有 商业 价值 的 曼彻斯特 标记 数 
据 流 模 型 (Manchester tagged dataflow model) 是 基于 动态 标记 方法 建造 的 ， 是 一 种 功能 强大 的 数据 流 
计算 机 的 范例 。 这 种 特殊 的 体系 结构 被 描述 为 标记 模型 ， 是 因为 各 种 数据 值 〈 令 牌 ) 都 采用 了 它们 唯 
一 的 标识 符 来 标记 ， 这 样 利用 这 些 标示 符 可 以 说 明和 指示 当前 程序 的 迭代 层次 。 由 于 程序 可 以 是 可 重 
和 人 的， 所 以 和 需要 使 用 标记 符 ; 可 重 入 意味 着 可 以 使 用 具有 不 同 数据 的 同一 个 代码 。 通过 比较 这 些 标记 
符 ， 系 统 可 以 决定 在 每 一 次 迭代 过 程 中 使 用 哪 一 个 数据 。 对 于 同一 条 指令 来 说 ， 已 经 匹配 标记 符 的 令 
牌 会 促使 这 个 节点 激活 。 

我 们 可 以 通过 二 个 循环 程序 的 例子 很 好 地 解释 标记 的 概念 。 如 果 这 个 循环 的 每 次 迭代 都 是 在 子 图 





图 9-12 计算 N! 的 程序 相对 应 的 数据 流 图 
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的 一 个 单独 实例 中 执行 ， 那 么 就 可 以 实现 一 个 更 高 层次 的 并 发 。 这 个 子 图 只 是 该 循环 的 数据 流 图 的 一 
个 副本 。 但 是 ， 邵 果 在 循环 中 有 很 多 的 迭代 过 程 ， 那 么 也 就 会 有 很 多 的 数据 流 图 的 副本 。 程 序 可 以 在 
一 个 图 的 不 同 实例 中 共享 节点 ， 这 样 会 比 多 次 重复 复制 一 个 图 更 好 、 更 有 效率 。 对 于 每 一 个 实例 来 说 ， 
它们 的 令 牌 都 必须 是 可 标识 的 ， 而 可 以 通过 给 每 一 个 令 牌 加 上 一 个 标记 来 实现 。 每 个 令 牌 的 标记 都 是 
用 来 标识 令 牌 所 属 的 实例 。 这 就 是 说 ， 用 于 第 三 次 迁 代 的 令 牌 不 能 促使 第 四 次 欠 代 中 的 节点 激活 。 

数据 流 机 器 的 体系 结构 由 许多 相互 之 间 必 须发 生 通信 的 处 理 单元 组 成 。 每 个 处 理 单元 都 有 一 个 使 
能 单元 〈 或 称 为 启动 单元 ，enabling unit) ， 使 能 单元 会 按 顺 序 接受 输入 的 令 牌 ， 并 将 它们 存放 在 存储 
器 中 。 当 有 某 个 被 编 址 的 令 牌 激 活 一 个 节点 时 ， 就 会 从 存储 器 中 抽取 出 相关 的 输入 令 牌 ， 并 将 这 些 令 
牌 与 该 节点 本 身 结 合 起 来 形成 一 个 可 执行 的 包 。 由 处 理 单元 中 的 功能 单元 〈functional unit) 计算 出 一 
些 必要 的 输出 值 ， 并 将 这 些 输出 值 和 目的 地 址 组 合 起 来 形成 更 多 的 令 牌 。 然 后 ， 这 些 令 牌 会 在 它们 启 
动 其 他 节点 的 时 候 被 送 回 使 能 单元 。 在 标记 令 牌 的 机 器 中 ， 使 能 单元 分 成 两 个 独立 的 阶段 ， 匹 配 单 元 
(matching unit) 和 提取 单元 (fetching unit) 。 匹 配 单元 把 输入 令 牌 存储 到 存储 器 中 ， 并 决定 -- 个 给 定 
目的 节点 的 实例 是 否 已 经 激活 。 在 标记 型 的 体系 结构 中 ， 目 的 节点 的 地 址 和 标记 都 必须 匹配 。 对 于 一 
个 节点 ， 当 所 有 匹配 的 令 牌 都 可 用 时 ， 就 会 将 这 些 令 牌 送 到 提取 单元 ， 提 县 单元 会 把 这 些 令 牌 和 该 节 
点 的 一 个 副本 组 合成 一 个 可 执行 的 包 ， 然 后 这 个 可 执行 的 包 被 传送 到 功能 单元 。 

因为 在 数据 流 系统 中 是 数据 驱动 处 理 流程 ， 所 以 数据 流 的 多 处 理 器 不 会 发 生 竞争 和 高 速 缓存 不 一 
致 的 问题 。 显 然 ， 这 些 问 题 对 于 设计 控制 驱动 的 多 处 理 器 的 人 来 说 是 非常 头痛 的 事情 。 非 常 有 趣 的 是 . 
冯 “， 诺 伊 曼 曾 经 研究 过 在 本 质 上 类 似 于 数据 流 计算 机 的 数据 驱动 的 体系 结构 的 可 能 性 ， 而 汉 “。 诺 伊 曼 
的 名 字 在 传统 计算 机 体系 结构 中 却 被 赋予 了 汉 、 诺 伊 曼 瓶 横 。 特 别 地 ， 汉 “， 诺 伊 曼 还 研究 了 神经 网 络 
的 可 行 性 。 从 性 质 上 来 说 ， 神 经 网 络 也 属于 数据 驱动 类 型 ， 我 们 将 在 下 一 部 分 进行 讨论 。 


9.5.2 神经 网 络 


传统 的 计算 机 体系 结构 非常 适合 于 一 些 需 要 进行 快速 算 述 运算 和 执行 确定 性 程序 。 然 而 ， 传 统 体 
系 结构 不 太 适 合 其 有 大 量 并 行 应 用 序 、 大 量 容错 、 或 者 需要 适应 变化 环境 的 情形 。 另 一 方面 ， 神经 网 
络 (neural networks) 在 不 能 用 公式 来 表示 一 个 确切 的 算法 方案 的 动态 环境 中 非常 有 用 。 在 这 里 ， 处 
理 过 程 通常 是 要 基于 前 面 行为 的 一 种 累积 结果 。 

汉 “' 诺 伊 曼 计算 机 是 基于 处 理 器 /存储 器 的 体系 结构 ， 而 神经 网 络 则 是 基于 人 脑 的 并 行 体 系 结构 。 
神经 网 络 试图 实现 简单 的 生物 神经 网 络 形式 。 神 经 网 络 代表 了 一 种 新 的 具有 高 度 互 连 性 和 简单 处 理 单 
元 的 多 处 理 器 计算 的 形式 。 神 经 网 络 可 以 处 理 不 精确 的 和 随机 性 的 信息 ， 并 且 具 有 某 些 机 制 允许 处 理 
单元 之 间 发 生 自 适应 的 相互 作用 。 神 经 网 络 (或 者 称 为 neural nets) 就 像 生物 学 的 网 络 一 样 ， 可 以 从 
经 验 中 学 习 。 

神经 网 络 计 算 机 由 大 量 简单 的 处 理 单元 组 成 。 每 个 单元 都 各 自 处 理 一 个 大 问题 中 的 一 小 部 分 。 简 
单 地 说 ， 神 经 网 络 由 处 理 单元 《PE) 组 成 ， 这 些 处 理 单元 会 将 各 种 输入 值 乘 以 不 同 的 权 ( 重 ) 值 ， 产 
生 一 个 单一 的 输出 值 。 与 神经 网 络 有 关 的 实际 计算 过 程 会 让 人 觉得 很 简单 ;一 个 神经 网 络 真正 的 处 理 
能 力 在 于 互 连 的 PE 的 并 行 处 理 和 各 组 权 值 的 自 适应 的 特性 。 创 建 神经 网 络 的 困难 在 于 如 何 确定 神经 
元 之 间 的 连接 方式 ， 在 网 络 边缘 应 该 设置 多 大 的 权 值 ， 以 及 应 该 如 何在 这 些 权 值 上 施加 不 同 的 闵 值 。 
此 外 ， 当 神经 网 络 在 学 习 时 ， 可 能 会 出 错 。 当 这 种 情况 发 生 时 ， 这 些 权 值 和 阔 值 都 必须 做 出 改变 以 补 
偿 修正 这 个 错误 。 神 经 网 络 的 学 习 算 法 (learning algorithm) 是 用 来 管理 如 何 改 变 这 些 权 值 和 阅 值 的 
一 组 规则 。 

神经 网 络 还 有 许多 人 们 所 熟知 的 其 他 不 同 的 名 称 ， 包 括 连接 器 系统 (connectionist) 、 自 适应 系统 
(adaptive system) 和 并 行 分 布 式 处 理 系 统 (parallel distributed processing system) 。 如 果 神 经 网 络 可 以 
使 用 一 个 大 型 的 包含 大 量 的 先前 例子 的 数据 库 和 从 先前 的 经 验 中 学 习 的 话 ， 那 么 这 些 系统 的 功能 会 特 
别 强 大 。 神 经 网 络 已 经 非常 成 功 地 应 用 在 大 量 实 际 应 用 程序 中 ， 包 括 质量 管理 ， 天 气 预报 ， 财 政和 经 
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济 预 报 ， 语 音 和 模式 识别 ， 石 油 和 天 然 气 开发 ， 卫 生 保 健 成 本 降低 ， 破 产 预测 ， 机 器 诊断 ， 证 券 交 易 
和 市 场 营 销 。 值 得 注意 的 是 ， 每 一 种 神经 网 络 都 是 专 为 某 个 特定 任务 而 设计 的 。 所 以 ， 我 们 不 能 利用 
一 个 为 预报 天 气 而 设计 的 神经 网 络 来 预测 经 济 ， 并 期 望 它 对 经 济 的 预测 做 得 很 好 。 

一 个 最 简单 的 神经 网 络 的 实例 是 感知 器 (perceptron)， 它 是 一 个 单一 的 可 训练 的 神经 元 。 感 知 器 
会 根据 从 多 个 输入 接收 到 的 值 产生 一 个 布尔 输出 。 感 知 器 是 可 训练 的 ， 
从 为 其 辣 值 和 输入 权 值 都 是 可 修改 的 。 图 9-13 描述 了 一 个 具有 输入 zz， 
za2，…，xzn 的 感知 器 ， 这 些 输入 值 可 以 是 布尔 值 ， 或 者 是 实际 值 。2Z 是 
感知 器 的 布尔 输出 。Wi 代表 感知 器 边缘 的 权 值 ， 而 且 都 是 一 些 实际 值 。 
表示 阐 值 ， 也 为 实际 值 。 在 这 个 例子 中 ， 当 输入 ww zi 十 zzzzy 十 …… 十 
wnzn 大 于 阔 值 全 时， 输出 值 Z 将 为 真 (1) 。 否 则 ，2 的 值 为 0。 

在 特定 的 输入 下 ， 感 知 器 会 按照 它 是 如 何 被 训练 的 来 产生 一 个 输出 
结果 。 如 果 这 种 训练 完全 正确 ， 则 可 以 给 感知 器 任意 输入 并 且 得 到 合理 的 正确 结果 。 即 使 感知 器 以 前 
从 来 没有 见 过 某 一 组 特定 的 输入 ， 感 知 器 也 应 该 能 够 得 出 一 个 合理 的 输出 。 输 出 结果 的 “合理 性 ” 取 
决 于 感知 器 的 训练 程度 的 好 坏 。 

感知 器 的 训练 过 程 可 以 使 用 监督 或 无 监督 学 习 算 法 。 监 督 (supervised) 学 习 算法 假设 先前 的 知识 都 
是 正确 的 结果 ， 这 些 正确 的 知识 会 在 训练 阶段 输入 到 神经 网 络 中 。 学 习 时 神经 网 络 会 被 告知 最 后 的 结果 
是 否 正确 。 如 果 输 出 的 结果 不 正确 ， 神 经 网 络 就 会 修改 输入 权 值 以 得 到 所 要 求 的 输出 结果 。 无 监督 《un- 
supervised) 学 习 算 法 是 在 训练 过 程 中 不 给 神经 网 络 提供 正确 的 输出 。 神 经 网 络 只 是 适应 着 去 响应 它 的 各 
种 输入 ， 学 习 如 何 识别 输入 组 合 中 的 各 种 模式 和 结构 。 在 本 例 中 ， 我 们 采用 的 是 监督 学 习 算 法 。 

训练 一 个 神经 网 络 的 最 好 办 法 是 编译 一 个 大 范围 的 实例 ， 可 以 展现 出 我 们 所 感 兴趣 的 各 种 特征 。 
因为 一 个 神经 网 络 最 多 可 以 做 到 与 训练 的 数据 一 样 好 ， 所 以 必须 非常 仔细 地 选择 足够 多 数量 的 正确 实 
例 。 例 如 ， 如 果 一 个 小 孩 所 看 到 过 的 唯一 的 一 只 鸟 是 一 只 鸡 ， 那 么 我 们 显然 不 能 期 望 他 能 够 识别 所 有 
的 鸟 。 通 过 为 感知 器 提供 一 些 输入 值 ， 然 后 检查 感知 器 的 输出 结果 ， 这 样 训 练 过 程 就 发 生 了 。 如 果 输 
出 的 结果 不 正确 ， 感 知 器 就 会 被 告知 需要 改变 其 输入 权 值 和 阔 值 以 避免 在 将 来 发 生 同 样 的 错误 。 而 且 ， 
如 果 我 们 给 一 个 小 孩 看 一 只 鸡 、 一 只 麻雀 、 一 只 鸭子 、 一 只 座 、 一 只 鹊 况 和 一 只 乌 锌 ,我 们 不 能 期 待 
这 个 孩子 只 看 了 一 次 后 就 可 以 记 住 这 些 动 物 的 相似 和 不 同 的 地 方 。 类 似 地 ， 神 经 网 络 也 必须 多 次 看 相 
同 的 例子 ， 才 能 推断 出 这 些 输 入 数据 的 特性 。 

人 们 可 以 非常 容易 地 训练 一 个 感知 器 识别 出 AND 操作 。 假 设 有 N 个 输入 ， 只 有 当 所 有 的 输入 都 
等 于 1 时 ， 输 出 结果 才 为 1。 如果 将 感知 器 的 阐 值 设置 为 >， 所 有 的 边缘 的 权 值 都 设 为 1， 那么 就 得 出 
了 正确 的 结果 。 另 一 方面 ， 为 了 计算 一 组 输入 值 的 OR， 这 里 只 需要 简单 地 将 阔 值 设置 为 1 这样， 只 
要 有 一 个 输入 为 1 时 ， 输 出 也 将 为 1。 

对 于 AND 和 OR 这 两 个 操作 符 来 说 ， 我 们 知道 闭 值 和 权 值 应 该 是 多 少 。 但 是 ， 对 于 一 些 复杂 的 问 
题 ， 这 些 值 是 不 知道 的 。 例 如 ， 如 果 我 们 不 知道 为 AND 操作 的 权 值 ， 我 们 可 以 从 权 值 0. 5 开始 ， 给 感 
知 器 以 不 同 的 输入 值 ， 当 输出 产生 不 正确 的 结果 时 就 对 权 值 进行 修改 。 神 经 网 络 就 是 这 样 训 练 完 成 的 。 
通常 ， 神 经 网 络 的 初始 权 值 是 一 个 在 一 1 到 1 之 间 随 机 数值 。 一 个 正确 的 训练 往往 需要 上 千 个 步 又。 
训练 所 性 的 时 间 取 决 于 网 络 的 大 小 。 当 感知 器 的 数量 增加 时 ， 可 能 的 “状态 ”数目 也 会 随 之 增加 。 

下 面 ， 我 们 考虑 一 个 更 复杂 的 例子 ， 确 定 一 辆 坦克 是 否 隐 藏 在 一 张 图 片 中 。 首 先 可 以 对 神经 网 络 
进行 设置 ， 使 神经 网 络 的 每 一 个 输出 值 都 与 一 个 确切 的 像素 相关 联 。 如 果 这 个 像素 是 图 像 中 坦克 的 一 
部 分 ， 神 经 网 络 应 该 输出 一 个 1。 和 否则， 网 络 的 输出 结果 为 0。 输入 的 信息 很 可 能 是 由 像素 的 颜色 组 
成 。 通 过 输入 大 量 包 含有 坦克 和 无 坦克 的 图 片 来 对 这 个 神经 网 络 进 行 训练 。 这 种 训练 会 一 直 持 续 下 去 ， 
直到 神经 网 络 能 够 正确 地 识别 图 片 中 是 否 包 含 坦克 为 止 。 

美国 军 方 曾 经 从 事 过 一 项 类 似 于 上 面 描述 过 的 研究 计划 。 研 究 中 使 用 了 两 组 照片 ， 其 中 一 组 的 一 
百 张 照片 中 包含 隐藏 在 树 和 灌木 从 后 面 的 坦克 ， 另 外 一 组 的 一 百 张 照片 中 只 有 普通 风景 而 没有 坦克 。 





图 9-13 ”感知 器 
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先 从 每 组 中 各 取出 50 张 照片 “秘密 ”放置 起 来 ， 而 用 剩 下 的 照片 来 训练 神经 网 络 。 在 每 次 输入 一 张 照 
片 前 ， 神 经 网 络 先 利 用 一 个 随机 的 权 值 进行 初始 化 。 当 神经 网 络 的 输出 结果 不 正确 时 ， 就 调整 其 输入 
权 值 直 到 能 得 到 正确 的 结果 。 在 神经 网 络 完成 训练 过 程 后 ， 再 将 每 组 中 的 50 张 “秘密 ”照片 送 到 神经 
网 络 ， 结 果 这 个 神经 网 络 正 确 地 识别 了 每 一 张 照片 中 是 否 存在 坦克 。 

这 里 ， 我 们 需要 解决 训练 的 一 个 实际 问题 是 ， 神 经 网 络 是 否 真 地 学 会 了 如 何 识别 坦克 ? 美国 国防 
部 五 角 大 楼 的 这 个 很 自然 的 疑问 引 来 了 更 多 的 测试 。 他 们 拍摄 了 另外 的 一 些 照 片 ， 并 将 它们 输入 到 神 
经 网 络 。 令 研究 人 员 肖 丧 的 是 ， 输 出 的 结果 完全 是 随机 。 这 个 神经 网 络 不 能 正确 地 识别 照片 中 的 坦克 。 
在 经 过 了 一 番 研 究 后 ， 研 究 人 员 发 现 原先 试验 的 200 张 照片 中 ， 所 有 存在 坦克 的 照片 都 是 在 一 个 阴 天 
拍摄 的 ， 而 那些 没有 坦克 的 照片 都 是 在 晴天 拍摄 的 。 这 个 神经 网 络 就 是 根据 天 空 的 颜色 来 恰当 地 区 分 
了 这 两 组 照片 ， 而 并 不 是 根据 照片 中 是 否 存在 一 辆 隐藏 的 坦克 。 这 样 一 来 ， 政 府 部 门 现在 就 非常 自豪 
拥有 了 一 个 的 昂贵 的 神经 网 络 ， 这 个 神经 网 络 可 以 正确 地 区 分 晴天 和 阴 天 。 

这 是 一 个 大 家 都 认为 有 关 神 经 网 络 的 最 大 问题 的 一 个 很 好 的 例子 。 如 果 存 在 大 于 10 到 20 个 神经 
元 的 情况 下 ， 想 要 理解 神经 网 络 是 如 何 得 出 其 输出 结果 简直 就 是 不 可 能 的 。 人 们 不 可 能 告诉 你 神经 网 
络 是 否 正 在 基于 正确 的 信息 做 出 决定 ， 或 者 就 像 上 面 介绍 的 例子 ， 有 些 事情 完全 是 不 相关 的 。 神 经 网 
络 具有 一 种 非凡 的 能 力 ， 就 是 它 能 够 从 人 脑 难 以 分 析 复 杂 数 据 中 推演 出 这 些 数据 的 含义 和 提取 出 数据 
的 模式 。 但 是 ， 有 些 人 相信 神经 网 络 能 在 被 训练 的 领域 成 为 专家 。 神 经 网 络 可 以 应 用 在 销售 预测 、 风 
险 管理 、 客 户 研究 、 海 底 矿藏 探测 、 面 部 识别 ， 以 及 数据 验证 这 些 领 域 。 神 经 网 络 前 景 非常 光明 ， 而 
且 在 过 去 的 几 年 中 所 取得 了 进步 ， 并 且 已 经 有 大 量 的 资金 投入 到 神经 网 络 的 研究 中 。 然 而 ， 还 是 有 很 
多 人 对 一 些 人 类 还 不 可 能 完全 理解 的 事情 缺乏 信心 。 


9.5.3 脉动 阵列 


脉动 阵列 (systolic array) 计算 机 的 名 字源 于 它 与 生物 中 血液 如 何 有 规律 地 流 过 心脏 的 相似 情形 。 
脉动 阵列 计算 机 是 一 种 处 理 单元 的 网 络 ， 它 通过 数据 不 断 在 系统 中 循环 而 有 节奏 地 对 数据 进行 计算 。 
它 是 SIMD 计算 机 的 一 种 变化 形式 ， 并 由 大 量 使 用 矢量 流水 线 处 理 数 据 流 的 简单 处 理 器 组 合 构成 ， 如 
图 9-14b 所 示 。 自 从 20 世纪 70 年 代 引入 脉动 阵列 计算 机 以 来 ， 脉 动 阵列 计算 机 已 经 对 特殊 功能 的 计 
算 产 生 了 重要 的 影响 。 一 个 著名 的 脉动 阵列 是 CMU 的 iWarp 处 理 器 ，1990 年 由 Intel 制造 完成 。 这 个 
系统 由 通过 一 条 双向 数据 总 线 连接 的 处 理 器 的 线性 阵列 组 成 。 

虽然 图 9-14b 描述 的 只 是 一 个 一 维 的 脉动 阵列 ， 但 是 二 维 脉动 阵列 也 是 很 常见 的 。 随 着 VLSI 技术 
的 不 断 发 展 ， 三 维 阵列 也 正 变 得 流行 起 来 。 

脉动 阵列 采用 一 种 高 度 并 行 执行 的 机 制 〈 通 过 流水 线 )， 
而 且 可 以 保持 一 个 非常 高 的 吞吐 量 。 通 常 ， 脉 动 阵列 的 连 线 
简短 ， 设 计 简单 ， 而 且 具 有 很 好 的 可 缩放 性 。 现 在 ， 脉 动 阵 je | 
列 计算 机 也 趋向 于 更 加 坚固 ， 高 度 紧凑 ， 高 效率 和 生产 成 本 rN pe b) 一 个 脉动 阵列 处 理 器 
更 加 便宜 。 缺 点 是 ， 脉 动 阵列 计算 机 是 高 度 专用 化 的 ， 因 此 
它们 所 能 解决 的 问题 类 型 与 大 小 都 是 很 难 发 生 改 变 的 。 

应 用 脉动 阵列 的 一 个 很 好 例子 是 多 项 式 的 计算 。 为 了 计算 多 项 式 > 一 ao 十 aiz 十 azzZ2 十 .… 十 akz4， 
可 以 使 用 Horner 法 则 : 

Y= (( az 十 a dXrF a 义工 十 aa) Xia) Xr a 

按照 Horner 法 则 ， 使 用 一 个 处 理 器 成 对 排列 的 线性 脉动 阵列 来 计算 多 项 式 的 值 ， 如 图 9-15 所 示 。 
处 理 器 会 把 它 的 输入 乘 以 zx， 并 将 结果 传递 到 
右边 的 处 理 器 。 下 一 个 处 理 器 则 把 传 来 的 结果 
加 上 a;， 再 将 结果 继续 向 右 传递 。 从 计算 开 
始 ， 经 过 最 初 的 2n 个 周期 的 延迟 后 就 可 以 完 





RH 


图 9:14 
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成 整个 计算 ， 每 个 周期 都 要 计算 一 项 多 项 式 。 

脉动 阵列 通常 用 于 一 些 需 要 重复 计算 的 任务 ， 包 括 傅立叶 〈Fourier) 变换 、 图 像 处 理 、 数 据 
压缩 、 最 短路 径 问 题 、 排 序 分 类 、 信 和 号 处 理 和 各 种 各 样 的 矩阵 计算 〈 例 如 矩阵 的 转 填 和 乘法 )。 
简 而 言 之 ， 脉 动 阵列 计算 机 非常 适合 于 需要 使 用 大 量 简单 处 理 单 元 来 进行 并 行 处 理 的 计算 问题 。 


本 章 小 结 


本 章 概述 了 一 些 有 关 多 处 理 器 和 多 计算 机 系统 的 重要 问题 。 这 些 系统 提供 了 一 些 高 效 地 处 理 各 种 复杂 
问题 的 方法 。 

有 关 RISC 和 CISC 的 争论 越 来 越 多 地 集中 到 了 芯片 体系 结构 的 比较 ， 而 不 是 指令 系统 。 人 们 真正 所 
关心 的 是 程序 的 执行 时 间 。 无 论 是 RISC 的 设计 者 ， 还 是 CISC 的 设计 者 都 会 继续 不 断 地 改进 系统 的 性 能 。 

Flynn 分 类 法 是 按照 指令 和 数据 流 的 数量 来 对 计算 机 的 体系 结构 进行 分 类 。MIMD 类 型 的 机 器 可 以 进 
一 步 划分 为 使 用 共享 存储 器 和 不 使 用 共享 存储 器 的 两 种 类 型 。 

现在 的 数字 计算 机 具有 惊人 的 处 理 能 力 。 在 超标 量 体 系 结构 和 超 流 水 线 体系 结构 中 ， 内 部 处 理 器 的 
并 行 执行 机 制 已 经 大 大 提升 了 系统 的 处 理 能 力 。 原 先 ， 处 理 器 一 次 只 能 做 一 件 事 情 ， 但 是 现在 处 理 器 执 
行 多 个 并 发 的 操作 已 经 是 一 件 很 普通 的 事 。 矢 量 处 理 器 支持 矢量 操作 ,而 MIMD 计算 机 中 包括 多 个 处 
理 器 。 

SIMD 处 理 器 和 MIMD 处 理 器 之 间 可 以 通过 互连网 络 进行 连接 。 共 享 存储 器 的 多 处 理 器 系统 可 以 将 一 
组 物理 存储 器 的 集合 作为 一 个 单一 的 实体 ， 而 分 布 式 存储 器 的 体系 结构 则 允许 每 个 处 理 器 单独 地 访问 自己 
的 存储 器 。 这 两 种 方法 都 允许 普通 用 户 以 可 承受 的 价格 得 到 超级 计算 。 目 前 ， 最 流行 的 多 处 理 器 体系 结构 
是 MIMD， 共 享 存储 器 和 基于 总 线 的 多 处 理 器 系统 。 

使 用 传统 的 计算 模型 不 可 能 解决 一 些 高 度 复杂 的 问题 。 新 的 体系 结构 对 解决 特殊 的 应 用 问题 是 十 分 必 
要 的 。 数 据 流 计 算 机 使 用 数据 来 驱动 和 控制 计算 过 程 ， 而 不 是 其 他 方式 。 神 经 网 络 会 自我 学 习 来 解决 某 些 
高 度 复杂 的 问题 。 脉 动 阵列 计算 机 会 组 合 大 量 小 处 理 单元 的 处 理 能 力 ， 推 动 数据 穿 过 整个 脉动 阵列 直到 问 
题解 决 。 


深入 阅读 


人 们 曾经 多 次 尝试 修改 Flynn 分 类 法 。Hwang (1987)、Bell (1989) 、Karp (1987)， 以 及 Hockney 和 
Jesshope 〈1988) 都 对 Flynn 分 类 法 进行 了 不 同 程度 的 扩充 。 

现在 有 许多 介绍 高 级 体系 结构 的 好 的 教科 书 ， 其 中 包括 Hennessy 和 Patterson (1990)，Hwang 
(1993) 和 Stone (1993) 的 著作 。Stone 在 书 中 详细 讨论 了 流水 线 操作 和 存储 器 组 织 ， 矢 量 计算 机 和 并 行 处 
理 。 要 想 详 细 了 解 现代 RISC 处 理 器 中 的 超标 量 体 系 结构 ， 可 以 阅读 Grohoski (1990) 的 文章 。 在 Patter- 
son 《1985) 以 及 Patterson 和 Ditzel (1980) 的 论文 中 非常 透彻 地 讨论 了 RISC 的 原理 ， 并 很 好 地 解释 了 指 
令 流 水 线 的 工作 流程 。 

有 关 VLSI 技 术 和 计算 机 处 理 器 设计 之 间 的 相互 影响 的 优秀 文章 ， 可 以 参阅 Hennessy (1984) 的 
论文 。Leighton (1982) 的 书籍 虽然 有 些 过 时 ， 但 在 体系 结构 和 算法 方面 有 很 好 的 见解 。 同 时 ， 它 也 
是 有 关 互 连 网 络 的 一 本 很 好 的 参考 书 。Omondi (1999) 对 计算 机 微型 体系 结构 的 实现 有 一 个 权威 性 
的 介绍 。 

有 关 数 据 流体 系 结构 和 不 同 的 数据 流 机 器 之 间 比 较 分 析 的 优秀 研究 文章 ， 可 以 参见 Dennis (1980)、 
Hazra (1982) 、Srini (1986) 、Treleaven et al，(1982) 和 Vegdahl (1984) 的 论文 。 
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基本 概念 和 术语 复习 

1， 当 时 为 什么 会 提出 RISC 体系 结构 ? 

2. 为 什么 RISC 处 理 器 比 CISC 处 理 器 更 容易 实现 流水 线 作业 ? 

3. 说 明 寄 存 器 窗口 如 何 使 过 程 调用 的 效率 更 高 。 

4. Flynn 分 类 法 是 基于 哪 两 大 特性 来 分 类 计算 机 体系 结构 的 ? 

5. 我 们 提议 在 Flynn 分 类 法 了 上 增加 一 个 层次 。 在 这 一 较 高 层次 上 ， 计 算 机 的 是 著 特征 是 什么 ? 


. 是 天 所 有 的 程序 问题 都 能 够 并 行 执行 ? 其 中 的 限制 内 崇 是 什么 ? 
. 定义 超级 流水 线 作 业 。 

. 超标 二 体系 结构 的 设计 和 超级 流水 线 设计 有 什么 区 别 ? 

.VLIW 设计 在 哪些 方面 不 同 于 超级 流水 线 设计 ? 


.EPIC 和 VLIW 之 间 的 异同 点 是 什么 ? 

.解释 寄存 器 到 寄存 器 的 和 撩 其 处 理 体系 结构 的 固有 “内 在) 局 限 性 。 
. 询 出 和 撩 二 处 理 器 高 效 的 两 种 原因 。 

出 6 种 主要 棋 连 网 拓扑 结 构 的 未 党 图 。 

. 有 :种 类 大 共 芝 存储 器 的 组 织 结构 。 它 们 是 哪 :种 ” 

， 捕 述 本 章 中 所 讨论 的 其 中 一 种 高 速 缓存 一 致 性 协议 。 

. 什么 是 SETI， 它 是 如 何 使 用 分 布 式 的 计算 模型 的 ? 

. 数据 流体 系 结 构 和 “传统 ”的 计算 体系 结构 有 什么 区 别 ? 

. 什么 是 可 重 人 代码 ? 

. 神经 网 络 的 基本 计算 单元 是 什么 ? 

. 描述 神经 网 络 是 如 何 学 习 的 ? 

. 脉动 阵列 是 通过 怎样 的 比喻 取得 这 个 名 字 的 ?为 什么 说 这 个 比喻 相当 地 准确 ? 
. 什么 样 的 问题 适合 于 利用 脉动 阵列 来 解决 ? 
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练习 题 


争 1. 
2. 


全 3， 
4. 


@5. 
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10， 


11 


为 什么 RISC 机 器 要 对 寄存 器 操作 ? 

RISC 系统 中 的 哪些 特性 能 够 直接 在 CISC 系统 中 实现 ? 又 有 哪些 RISC 机 器 的 特性 不 能 在 CISC 机 器 上 
实现 ? (参考 表 9-1 中 列 出 的 两 种 体系 结构 的 特性 的 定义 ) 

在 精简 指令 集 计 算 机 中 的 “精简 ”的 实际 含义 是 什么 ? 

假设 一 个 RISC 机 器 使 用 具有 如 下 特性 的 重 倒 寄存 器 窗口 : 

10 个 全 局 寄存 器 

6 个 输入 参数 寄存 器 

10 个 局 部 寄存 器 

6 个 输出 参数 寄存 器 

请 问 每 个 重合 寄存 器 窗口 有 多 大 ? 

一 个 RISC 处 理 器 具有 8 个 全 局 寄存 器 和 10 个 寄存 器 和 窗口。 每 个 寄存 器 窗口 有 4 个 输入 寄存 器 ，8 个 局 
部 寄存 器 和 4 个 输出 寄存 器 。 在 这 个 CPU 中 共有 多 少 个 寄存 器 ? (提示: 由 于 窗口 的 循环 特性 ， 最 后 一 
个 窗口 的 输出 寄存 器 被 共享 为 第 一 个 窗口 的 输入 寄存 器 ) 


,一 个 RISC 处 理 器 中 共有 152 个 寄存 器 ，12 个 全 局 寄存 器 。 共 有 10 个 寄存 器 窗口 ， 每 个 窗口 有 6 个 输入 


寄存 器 和 6 个 输出 寄存 器 。 在 每 个 窗口 中 有 多 少 个 局 部 寄存 器 ? 


. 一 个 RISC 处 理 器 中 有 186 个 寄存 器 ，18 个 全 局 寄存 器 。 共 有 12 个 寄存 器 窗口 ， 每 个 寄存 器 窗口 有 10 


个 局 部 寄存 器 。 在 每 一 个 寄存 器 窗口 中 有 多 少 个 输入 和 输出 寄存 器 ? 


. 假设 一 个 RISC 机 器 使 用 重 登 寄存 器 窗口 在 各 个 过 程 之 间 进 行 参数 的 传递 。 机 器 有 298 个 寄存 器 ， 每 个 


寄存 器 窗口 有 32 个 寄存 器 ， 其 中 10 个 是 全 局 变量 ， 而 10 个 是 局 部 变量 。 回 答 下 面 问题 : 
a) 有 多 少 个 寄存 器 可 以 用 来 输入 参数 ? 

b) 有 多 少 个 寄存 器 可 以 用 来 输出 参数 ? 

c) 有 多 少 个 寄存 器 窗口 可 以 使 用 ? 

d) 在 每 次 过 程 调用 中 ， 当 前 窗口 指针 (CWP) 会 增 量 多 少 ? 


.回顾 第 8 章 关于 关联 转换 的 讨论 。 当 一 个 进程 停止 使 用 CPU， 而 另 一 个 进程 开始 使 用 CPU 时 ， 就 会 发 


生 关 联 转换 。 在 这 种 情形 下 ， 寄 存 器 窗口 被 认为 RISC 机 器 的 一 个 潜在 的 缺点 。 解 释 为 什么 会 有 这 种 

情况 ? 

假设 一 台 RISC 机 器 使 用 5 个 寄存 器 窗口 : 

a) 在 寄存 器 的 内 容 必须 被 保存 到 存储 器 之 前 ， 过 程 调 用 可 以 进行 多 深 ? 〈 也 就 是 说 ， 在 我 们 需要 把 任意 
寄存 器 的 内 容 保存 到 存储 器 中 前 可 以 产生 的 “活动 的 ”过 程 调用 的 最 大 数目 是 多 少 ?) 

b) 如 果 要 在 a) 部 分 中 达到 最 大 值 后 再 增加 两 次 调用 ， 那 么 结果 会 有 多 少 个 寄存 器 窗口 必须 被 保存 到 
存储 器 中 ? 

c) 现在 假设 最 新 近 调 用 的 过 程 返 回 。 试 解释 会 发 生 什 么 情况 ? 

d) 现在 假设 再 多 调用 一 个 过 程 ， 那 么 又 有 多 少 个 寄存 器 窗口 需要 保存 到 存储 器 中 。 

. 在 Flynn 分 类 法 中 : 

人 a) SIMD 代表 什么 意思 ? 给 出 一 个 简单 的 描述 和 举 一 个 例子 。 

b) MIMD 代表 什么 意思 ? 给 出 一 个 简单 的 描述 和 举 一 个 例子 。 


.Flynn 分 类 法 包含 4 个 主要 的 计算 模型 。 简 要 地 描述 每 个 类 别 ， 并 给 出 每 个 模型 可 能 使 用 的 一 个 高 级 问 


题 的 例子 。 


. 解释 松散 耦合 的 体系 结构 和 紧密 耦合 的 体系 结构 之 间 的 区 别 。 
. 描述 MIMD 多 处 理 器 可 以 区 别 于 多 计算 机 系统 或 计算 机 网 络 的 特性 。 
. SIMD 和 MIMD 有 什么 相似 之 处 ? 它们 之 间 又 有 什么 区 别 ? 注意 ， 这 里 不 是 定义 术语 ， 而 是 要 比较 


模型 。 
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. SIMD 和 SPMD 之 间 有 什么 区 别 ? . 

:SIMD 最 适合 于 什么 类 型 的 程序 级 的 并 行 执行 数据 或 控制 )? 而 什么 类 型 的 程序 级 的 并 行 执行 是 最 适 
合 MIMD 的 ? 

. 针对 指令 级 的 并 行 执行 ， 简 要 描述 和 比较 VLIW 模型 和 超标 量 体 系 结构 模型 。 

. 哪 一 种 模型 ， 是 VLIW 还 是 超标 量 体 系 结构 ， 对 编译 器 提出 更 大 的 挑战 ? 为 什么 ? 

. 比较 和 对 比 超标 量 体 系 结构 和 VLIW 体系 结构 。 

. 为 什么 需要 分 布 式 系统 ? 

. UMA 和 NUMA 之 间 有 什么 不 同 ? 

. 在 互连网 络 中 使 用 交叉 开关 有 什么 主要 问题 ? 而 使 用 基于 总 线 的 连接 又 会 出 现 什 么 问题 ? 

. 已 知 在 下 面 的 Omega 网 络 中 ， 人 允许 8 个 CPU (Po 到 P7) 访问 8 个 存储 器 模块 (M0 到 M7?7); 


处 理 器 第 1 级 第 2 级 ”第 3 级 模块 





a) 描述 下 面 的 各 种 连接 是 如 何 通过 网 络 实现 的 (解释 如 何 设置 每 个 开关 )。 引 用 开关 是 使 用 符号 1A， 
2B 等 ， 
UDP0 -> M2 
it) P4 -> M4 
iii) P6 --> M3 

b) 这 些 连接 是 否 可 以 同时 发 生 ， 或 者 它们 会 发 生 冲突 吗 ? 解释 原因 。 

c) 列 出 一 个 在 a) 中 没有 给 出 的 将 会 与 P0 -之 M2 发 生 冲 突 (或 被 阻塞 ) 的 处 理 器 到 存储 器 的 访问 过 
程 。 

d) 列 出 一 个 没有 在 a) 中 给 出 的 不 会 被 P0 -之 M2 阻塞 的 处 理 器 到 存储 器 的 访问 过 程 。 


全 25. 描述 用 于 存储 器 共享 系统 中 的 写 通 和 回 写 高 速 缓存 修改 策略 ， 并 简 述 这 两 种 方案 的 优 缺 点 。 
26. 数据 流 系 统 中 的 存储 器 应 该 是 关联 存储 器 还 是 基于 地 址 的 存储 器 ? 解释 原因 。 

急 27. 神经 网 络 是 按 顺 序 处 理 信息 的 吗 ? 解释 原因 。 

28. 对 于 神经 网 络 ， 比 较 和 对 比 监督 学 习 算法 和 无 监督 学 习 算法 。 

全 29. 从 一 个 数学 的 观点 来 描述 神经 网 络 中 的 有 监督 的 学 习 过 程 。 

30. 下 面 有 两 个 问题 涉及 到 神经 网 络 的 单一 感知 器 : 


a) 逻辑 非 (NOT) 比 逻辑 与 “AND) 和 逻辑 或 (OR) 的 情况 稍微 难处 理 一 些 ,但 也 可 以 完成 。 在 这 
种 情况 下 ， 只 有 一 个 布尔 值 输入 。 这 里 设置 哪些 权 值 和 阔 值 才能 使 得 这 个 感知 器 能 够 识别 逻辑 非 
(NOT) 的 操作 符 ? 

b) 证 明 对 于 两 个 输入 zx， 和 z, ， 使 用 一 个 简单 的 感知 器 不 能 解决 二 进 制 的 异 或 (XOR) 问题 。 


31. 解释 SIMD 与 一 维 脉动 阵列 计算 之 间 的 区 别 。 
32. 相对 于 Flynn 分 类 法 ， 脉 动 阵列 属于 哪 一 类 ? 工作 站 群集 又 属于 哪 一 类 ? 
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33. 


在 对 应 的 空白 处 标记 一 个 C (CISC) 或 者 是 一 个 及 CRISC) ， 分 别 指出 下 面 的 内 容 是 属于 CISC 还 是 
RISC? 

_  _@ 平均 每 个 时 钟 周期 要 执行 的 简单 指令 。 
_  _@ 单一 寄存 器 组 。 
图 编译 器 中 的 复杂 性 问题 。 

_  _@ 高 度 流水 线 作业 。 

_  _@ 任何 指令 都 可 以 引用 存储 器 。 

_  @@ 指令 被 微 程序 解释 。 
固定 长 度 、 容 易 译 码 的 指令 格式 。 
图 高 专用 的 、 不 经 常 使 用 的 指令 。 

~ 使 用 重 肥 寄存 器 窗口 。 

_ 图 相对 较 少 的 寻 址 模式 。 





没有 度量 就 没有 管理 。 

-- -Peter Drucker 

数字 并 不 是 总 能 描述 事实 。 
- 一 美国 主语 


第 10 章 性 能 度量 和 分 析 


本 章 开始 所 引 的 两 条 谚语 凸现 了 计算 机 性 能 评估 方面 所 面临 的 两 难 境遇 。 我 们 必须 要 有 定量 的 工 
具 来 度量 计算 机 的 性 能 ， 但 是 我 们 又 如 何 确定 为 某 个 任务 所 选择 的 度量 工具 是 否 满足 评价 的 目标 呢 ? 
事实 上 ， 人 们 不 可 能 总 是 非常 确定 这 类 事情 。 此 外 ， 系 统 供应 商 常 常 有 强烈 的 意愿 去 突出 一 些 真实 的 
数字 ， 以 便 使 自己 品牌 的 计算 机 系统 看 起 来 优 于 他 们 的 竞争 者 。 

如 果 大 家 对 计算 机 性 能 评价 的 基本 知识 有 一 个 全 面 的 了 解 ， 那 么 就 不 难 抵御 那些 通过 统计 数字 所 
做 的 宣传 。 本 章 中 所 介绍 的 基础 知识 ， 无 论 是 对 于 选 购 新 计算 机 ， 还 是 对 于 改进 现 有 系统 的 性 能 都 是 
非常 有 用 的 。 

本 章 还 会 介绍 影响 处 理 器 、 程 序 和 磁盘 存储 器 性 能 的 一 些 因素 。 本 章 的 主要 思想 是 考虑 系统 的 调 
试 。 好 的 系统 性 能 测量 工具 (通常 由 生产 厂家 提供 ) 是 保持 系统 运行 在 最 佳 状态 的 一 个 不 可 缺少 的 畏 
助手 段 。 在 学 完 这 一 章 后 ， 我 们 将 知道 应 该 在 系统 的 调试 报告 中 去 寻找 什么 ， 以 及 其 中 的 每 个 信息 项 
怎样 来 构建 系统 的 整体 性 能 。 


10.2 基本 的 计算 机 性 能 方程 式 


在 前 面 章节 中 ， 我 们 已 经 多 次 看 到 了 这 个 基本 的 计算 机 的 性 能 方程 式 。 这 个 等 式 是 度量 计算 机 性 
能 的 基础 ， 它 度量 的 是 CPU 的 处 理 时 间 : 

时 间 _ 时间 、 周 期 数 、 指 令 数 

程序 周期” 指令 程序 

这 里 每 个 程序 的 时 间 就 是 所 需 的 CPU 时 间 。 对 这 个 方程 进行 分 析 不 难看 出 CPU 的 优化 过 程 可 以 
对 机 器 性 能 产生 很 大 影响 。 我 们 已 经 讨论 了 利用 这 个 方程 式 来 提升 系统 性 能 的 几 种 方式 。RISC 结构 的 
计算 机 采用 的 是 尽力 减少 每 条 指令 需要 的 时 钟 周期 数 ， 而 CISC 机 器 则 是 设法 减少 每 个 程序 中 的 指令 
数 。 矢 量 处 理 器 和 并 行 处 理 器 也 是 通过 降低 CPU 时 间 来 提升 性 能 。 其 他 一 些 改进 CPU 性 能 的 方法 将 
在 本 章 后 面 的 部 分 讨论 。 

当然 ， 对 CPU 进行 优化 并 不 是 增强 系统 性 能 的 唯一 途径 。 存 储 器 和 WO 对 系统 处 理 能 力也 有 很 大 
的 影响 。 但 是 ， 存 储 器 和 I/(0) 的 影响 不 能 够 用 这 个 方程 式 来 说 明 。 要 增强 系统 的 整体 性 能 ， 可 以 有 以 
下 几 种 选择 方案 : 

“CPU 优化 (CPU optimization) 一 一 最 大 限度 地 提高 CPU 所 执行 的 各 种 操作 的 速度 和 效率 (性 

能 方程 式 强调 的 就 是 这 个 优化 过 程 )。 

。 存 储 器 优化 (memory optimization) -一 -最 大 幅度 地 提升 代码 的 存储 器 管理 的 效率 。 

“1/O 〇 优化 (I/O optimization) 一 一 最 大 限度 地 增强 输入 /输出 操作 的 效率 。 

应 用 程序 的 整体 人 性 受到 上 述 三 种 因素 的 其 中 一 种 因素 的 限制 ， 我 们 分 别称 为 CPU 约束 (CPU 
bound) 、 存 储 器 约束 (memory bound) 和 IO 约束 (I/O bound)。 在 本 章 中 ， 我 们 在 所 有 这 三 个 层次 
上 进行 计算 机 系统 的 优化 。 

在 研究 优化 技术 之 前 ， 先 来 回忆 一 下 Amdahl 定律 。 这 个 定律 制约 着 通过 所 有 优化 方法 所 能 达到 
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的 潜在 的 系统 加 速 结 果 。Amdahl 定律 指出 计算 机 通过 使 用 某 种 较 快 的 执行 模式 可 以 获得 的 性 能 改善 
程度 ， 受 到 这 种 快速 模式 所 占用 的 系统 时 间 的 比例 的 限制 ， 


$ 


1 

OD 于 7 

其 中 ，S 表示 系统 获得 的 加 速率 ，f 代表 由 新 的 快速 部 件 〈 或 增强 部 件 ) 所 完成 的 工作 部 分 , & 代 
表 新 部 件 〈 或 增强 部 件 ) 的 加 速率 。 

因此 ， 人 们 意识 到 只 有 当 使 用 最 频繁 的 部 件 的 性 能 得 到 改进 时 ， 系 统 性 能 才 有 可 能 实现 重大 改进 。 
简单 地 说 ， 在 改善 系统 性 能 过 程 中 ， 我 们 通过 加 速 最 常用 的 组 件 ， 就 可 以 获得 最 大 的 收益 。 要 改善 系 
统 的 人 性能， 首先 要 知道 系统 或 程序 是 CPU 约束 ,存储 器 约束 ,还 是 7O 约束 。 在 讨论 和 进行 系统 性 能 
改进 时 ， 读 者 应 该 要 牢记 这 些 观点 。 下 面 先 开始 讨论 系统 整体 性 能 的 各 种 度量 方法 ， 然 后 再 介绍 一 些 
与 单独 的 系统 组 件 的 性 能 相关 的 因素 。 在 开始 讨论 这 些 话 题 之 前 ， 首 先 介绍 一 些 理 解 计算 机 性 能 度量 
所 必需 的 基本 的 数学 概念 。 


10.3 数学 预备 知识 


计算 机 性 能 评价 是 一 门 定 量化 的 科学 。 一 些 数学 和 统计 工具 提供 了 许多 方法 来 评估 计算 机 系统 的 
整体 性 能 和 计算 机 的 各 个 组 成 部 件 的 性 能 。 事 实 上 ， 因 为 有 很 多 方法 都 可 以 用 来 对 计算 机 系统 的 性 能 
进行 量化 评测 ， 所 以 选择 一 种 正确 的 统计 方法 已 经 变 成 度量 方法 中 的 一 种 挑战 。 本 节 将 描述 最 通用 的 
“普通 ”计算 机 性 能 的 度量 方法 ， 然 后 介绍 每 种 方法 的 适用 范围 。 本 节 第 二 部 分 介绍 一 些 其 他 方法 ， 这 
里 由 于 错误 推理 会 误 用 这 些 数量 信息 。 在 继续 讨论 之 前 ， 需 要 先 给 出 一 些 定义 。 

系统 性 能 的 度量 通常 取决 于 个 人 观点 。 计 算 机 用 户 最 关心 的 是 系统 响应 时 间 (response time); 系 
统 完成 一 个 任务 需要 多 长 时 间 ? 系统 管理 员 最 关心 的 是 系统 吞吐 量 (或 称 为 处 理 能 力 ，throughput ) : 
在 不 会 对 反应 时 间 产 生 较 大 不 利 影响 的 情况 下 能 够 执行 多 少 个 并 发 任务 ?” 显然 ， 这 两 个 观点 是 反 向 关 
联 的 。 更 明确 地 讲 ， 如 果 一 个 系统 在 & 秒 内 执行 一 个 任务 ， 则 它 执行 这 些 任务 的 吞吐 量 就 是 每 秒 1 人。 

要 比较 两 个 系统 的 性 能 ， 我 们 可 以 测量 在 每 个 系统 完成 等 量 的 任务 时 ， 各 自 所 需要 的 时 间 。 如 果 
同一 个 的 程序 在 两 个 不 同 的 系统 上 运行 ， 例 如 系统 A 和 系统 B， 那 么 如 果 满 足下 面 的 关系 ， 就 表示 系 
统 的 运行 速度 A 比 系统 B 快 n 售 : 

在 系统 B 上 的 运行 时 间 _， 

在 系统 A 上 的 运行 时 间 

如 果 满 足下 面 的 关系 ， 则 表示 系统 的 运行 速度 A 比 系统 B 快 z%: 

(在 要 统 如 上 的 运行 时 间 “1 

在 系统 A 上 的 运行 时 间 

下 面 考虑 两 台 赛 车 的 性 能 。 赛 车 A 用 3 分 钟 完成 10 英里 的 路 程 ， 而 赛车 B 则 在 4 分 钟 内 完成 同样 
的 10 英里 路 程 。 现 在 使 用 上 面 的 性 能 公式 ， 可 以 知道 赛车 A 的 性 能 比赛 车 B 快 1.25 售 : 


赛车 B 行 使 10 英 里 的 时 间 _ 4 .| ;; 
赛车 A 行使 10 英 里 的 时 间 ”3 


同样 可 以 得 出 ， 赛 车 A 比赛 车 B 快 25%: 

赛车 B 行 使 10 英 里 的 时 间 _ 

赛车 A 行使 10 英里 的 时 间 

这 些 公式 在 比较 一 个 系统 的 平均 性 能 和 另 一 个 系统 的 平均 性 能 时 非常 有 用 。 然 而 ， 最 后 得 出 的 数 
字 结 果 主 要 取决 于 “平均 ”的 定义 在 实际 的 机 器 性 能 上 所 代表 的 含义 。 


10. 3. 1 平均 数 的 意义 


统计 科学 告诉 我 们 ， 如 果 想 得 到 有 意义 的 信息 ， 必 须 进 行 足够 多 的 测试 来 证 明基 于 这 些 测试 结果 所 得 
出 的 推论 是 正确 的 。 测 试 过 程 中 的 变化 性 越 大 ， 测 试 取样 量 也 应 该 越 多 。 在 进行 “足够 多 ”次 数 的 测试 后 ， 
需要 使 用 一 种 合理 的 方式 对 数据 进行 组 合 ， 或 平均 ， 以 形成 一 种 简明 的 “集中 趋势 的 度量 (measure of cen- 





(FD) X100=25% 
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tral tendency)”。 集 中 趋势 的 度量 可 以 指出 取样 系统 〈 对 象 总 数 ，population) 的 预期 行为 。 但 是 ， 并 不 是 所 
有 的 数据 平均 的 方法 都 是 等 价 的 。 要 选择 的 方法 取决 于 数据 本 身 的 特点 和 测试 结果 的 统计 分 布 。 





算术 平均 值 是 大 家 最 熟悉 的 一 种 方式 。 如 果 有 5 个 测量 结果 ， 将 它们 加 在 一 起 并 除 以 5， 得 到 的 
结果 就 是 算术 平均 值 (arithmetic mean) 。 当 大 家 提 到 一 些 计量 的 平均 结果 时 〈 例 如 过 去 一 年 的 汽油 价 
格 ) ， 通 常 是 指 按照 一 些 给 定时 间 间 隔 对 价格 进行 取样 后 求 得 的 平均 值 。 

算术 平均 值 方法 不 应 该 用 于 数据 变化 幅度 较 大 ， 或 者 是 数据 朝 着 较 低 数值 或 较 高 数值 发 生 倾斜 的 
情况 。 下 面 ， 考 虑 表 10-1 所 示 的 3 台 计 算 机 的 性 表 10-1 5 个 程序 分 别 在 3 个 系统 上 
能 数值 。 这 些 数 值 是 5 个 程序 分 别 在 3 台 计 算 机 运行 的 平均 时 间 ， 时 间 单 位 为 秒 
上 的 运行 时 间 的 结果 。 观 察 这 些 运行 时 间 ， 可 以 : 
看 出 这 3 台 计 算 机 的 性 能 显然 是 不 同 的 。 如 果 仅 
仅 是 使 用 运行 时 间 的 算术 平均 值 来 报告 计算 机 的 
性 能 ， 那 么 性 能 不 同 这 个 事实 将 会 完全 被 掩盖 掉 。 

在 恰当 使 用 算术 平均 的 方法 时 ， 人 们 又 使 用 
了 加 权 算 术 平 均 (weighted arithmetic mean) 来 对 
算术 平均 进行 改进 ， 因 为 加 权 算术 平均 提供 了 一 
个 有 关系 统 的 预期 〈expected) 行为 的 清晰 图 像 。 
如 果 我 们 可 以 得 到 一 些 有 关 在 系统 日 常事 务 处 理 中 这 5 个 程序 运行 的 频繁 程度 〈 频 率 ) 的话， 那么 就 
可 以 使 用 这 5 个 程序 执行 的 组 合 过 程 来 计算 每 个 系统 的 相对 期 望 性 能 。 加 权 平 均值 是 通过 每 个 程序 运 
行 的 频率 及 其 运行 时 间 的 乘积 来 计算 的 。 把 加 权 运 行 时 间 进 行 平均 就 得 到 加 权 算 术 平 均值 。 

表 10-2 中 重新 列 出 了 表 10-1 中 系统 A 和 系统 C 的 程序 运行 时 间 ， 再 在 运行 时 间 表 中 补充 每 个 程 
序 的 执行 的 频率 。 例 如 ,在 系统 A 上， 在 程序 组 合 v、w、z、y、x 的 每 100 次 执行 中 ， 程 序 y 执行 了 
5 次。 我 们 得 出 ， 在 系统 A 上 这 5 个 程序 执行 时 间 的 加 权 平 均值 为 : 

50X0. 5 十 200X0, 3 十 250X0.1 十 400X0.05 十 5000X0.05 王 380 

类 似 的 计算 指出 ， 在 系统 B 上 5 个 程序 执行 时 间 的 加 权 平 均值 是 695 秒 。 通 过 使 用 加 权 平均 ， 我 
们 可 以 清楚 地 看 到 在 这 种 特定 的 任务 环境 下 ， 系 统 A 大 约 比 系统 C 快 83%。 

在 使 用 加 权 平 均 时 ， 最 容易 出 错 的 方式 是 使 用 一 些 一 成 不 变 的 假设 。 现 在 ， 假 设 某 公 司 的 计算 机 
工作 量 的 执行 组 合 形式 如 图 10-2 所 示 。 基 于 这 些 信息 ， 公 司 愿意 购置 系统 A 而 是 不 系统 C。 假 如 有 一 
个 精明 的 用 户 Wally。 他 断定 程序 z 可 以 给 出 和 运行 程序 v 同样 的 结果 ， 然 后 他 把 程序 = 的 结果 用 作为 
程序 w 的 输入 。 另 外 ， 因 为 程序 需要 很 长 时 间 来 运行 ， 所 以 Wally 也 就 有 了 很 好 的 借口 来 喝 杯 咖啡 
休息 一 下 。 不 久 ，Wally 的 发 现 传 遍 了 整个 办 公 室 ， 实 际 上 Wally 部 门 中 的 每 个 人 都 在 采用 他 的 思想 。 
在 这 些 日 子 里 ， 系 统 A 的 工作 量 的 分 布 图 看 起 来 就 如 表 10-3 所 示 。 管 理 部 门 的 人 员 肯 定 不 知道 全 新 的 
计算 机 系统 为 什么 会 突然 表现 出 如 此 差 的 性 能 。 

表 10-2 在 两 个 系统 上 5 个 程序 执行 表 10-3 ”使 用 一 个 修改 的 执行 组 合 后 ， 

组 合 和 运行 时 间 的 加 权 平 均值 系统 A 的 运行 时 间 的 加 权 平 均值 


























2817. 5 秒 
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从 前 面 的 讨论 中 我 们 知道 ， 如 果 测 量 中 数据 有 比较 大 的 变化 性 则 不 宜 使 用 算术 平均 值 。 另 外 ， 除 非 
我 们 对 静态 的 和 具有 代表 性 的 系统 工作 量 有 一 个 清楚 的 认识 ， 和 否则 使 用 加 权 算 术 平 均值 同样 无 效 。 几 何 
平均 值 geometric mean) 则 不 管 数据 的 分 布 如 何 都 能 给 我 们 一 个 可 以 用 来 实行 系统 比较 的 一 致 的 数字 

从 形式 上 看 ， 几 何平 均值 定义 为 n 个 测量 结果 乘积 的 n 次 根 。 用 公式 表述 如 下 : 

GE (x Xz XB 

在 比较 两 个 系统 的 相对 性 能 时 ， 几 何平 均值 比 算术 平均 值 更 有 用 处 。 当 我 们 相对 于 一 个 只 是 用 作 
为 参考 的 通用 机 器 来 说 明 这 些 系统 时 ， 系 统 之 间 性 能 结果 就 会 变 得 很 容易 进行 比较 。 当 采用 一 个 程序 
在 参考 机 器 上 的 运行 时 间 与 相同 的 程序 在 要 评估 的 系统 上 的 运行 时 间 的 比值 时 ， 我 们 说 这 些 要 评估 的 
系统 相对 于 参考 机 器 是 归 一 化 的 (normalized) 。 

为 了 求 出 归 一 化 比值 的 几何 平均 值 ， 我 们 先 把 这 个 比值 相 乘 后 再 取 n 次 根 。 系 统 A 和 系统 C 相 
对 于 系统 B 的 归 一 化 的 几何 平均 值 计 算 如 下 : 

系统 A 的 几何 平均 值 = (100/50X400/200X500/250X800/400X4100/5000)W52 1. 6733 

系统 C 的 几何 平均 值 = (100/500 X400/600X500/500X800/800X4100/3500)1/52 0. 6898 

计算 的 细节 过 程 如 表 10-4 所 示 。 


表 10-4 几何 平均 值 ， 由 每 个 系统 的 归 一 化 执行 时 间 的 乘积 的 5 次 根 求 出 












几何 平均 值 的 一 个 很 好 的 特性 是 不 管 选 取 哪 个 系统 作为 参考 机 器 ， 都 会 得 到 相同 的 结果 。 表 10-5 
显示 了 用 系统 C 作为 参考 机 器 时 的 结果 。 注 意 : 不 管 选择 哪个 系统 作为 参考 机 器 ， 几 何平 均值 的 比值 
都 是 一 致 的 : 


表 10-5 利用 系统 C 作为 参考 系统 所 求 得 的 几何 平均 值 





系统 A 的 几何 平均 值 、| 6 市 
系统 B 的 几何 平均 什 1 67， 
系统 B 的 几何 平均 值 
系统 C 的 元 何平 声 值 兴工 45， 而 
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系统 A 的 几何 平均 值 、， ,3 
系统 C 的 几何 平均 值 ““ 


如 果 将 系统 A 作为 参考 机 器 ， 也 会 得 到 相同 的 比值 。 

几何 平均 值 证 实 了 我 们 有 关系 统 A 和 系统 C 相对 性 能 的 思考 的 直觉 。 通 过 求 几 何平 均值 的 比率 ， 
不 难 发 现 系统 A 比 系统 C 给 出 一 个 差 得 多 的 性 能 结果 。 然而， 几何 平均 值 并 不 是 线性 关系 。 虽 然 系 统 “ 
人 与 系统 C 的 性 能 的 几何 平均 值 之 比 是 2. 43， 但 是 这 不 意味 着 系统 C 比 系统 A 快 2.43 倍 。 从 原始 数 
据 来 看 ， 这 一 事实 是 很 明显 的 。 因 此 ， 想 购买 系统 C 的 人 如 果 认 为 系统 C 在 性 能 上 是 系统 A 的 2 倍 ， 
那 他 们 肯定 会 大 失 所 望 。 与 加 权 算 术 平 均值 不 同 ， 几 何平 均值 在 明确 表述 计算 机 系统 的 实际 行为 的 统 
计 期 望 结 果 方 面 是 绝对 没有 帮助 的 。 

儿 何 平均 值 的 第 二 个 问题 在 于 ， 较 小 的 数值 对 整体 结果 的 影响 不 是 成 正比 的 。 例 如 ， 如 果 系 统 [C 
的 制造 商 将 测试 组 中 最 快 〈 可 能 是 最 简单 的 ) 的 程序 性 能 提升 20%， 即 运行 时 间 由 500 秒 降 至 400 秒 ， 
那么 归 一 化 的 几何 平均 值 将 提升 4 .5 入 。 而 如 果 将 这 一 性 能 提升 40% (这 样 程序 可 以 在 300 秒 内 究 
成 )， 则 归 一 化 的 几何 平均 值 的 增加 超过 16% 。 无 论 将 哪个 程序 的 性 能 提升 20% 或 是 40%， 我 们 发 现 
相对 几何 平均 值 都 同样 会 减少 。 可 以 预期 要 将 一 个 大 型 复杂 的 程序 的 运行 时 间 缩 减 700 秒 会 比 将 一 个 
较 小 的 简单 程序 的 运行 时 间 缩 减 200 秒 要 困难 得 多 。 从 Amdahl 定律 可 知 ， 在 实际 的 计算 机 志 界 中 ， 
最 大 、 最 耗 时 的 程序 将 对 系统 性 能 产生 最 大 的 影响 。 








当 我 们 把 数据 表示 为 速率 时 ， 例 如 每 秒 钟 完成 的 操作 数 ， 无 论 是 用 几何 平均 值 ， 还 是 用 算术 平均 
值 来 评价 计算 机 的 性 能 都 是 不 合适 的 。 为 了 计算 平均 速度 或 平均 比率 ， 应 该 使 用 调和 平均 值 (harmon- 
ic mean) 。 利 用 调和 平均 值 可 以 组 成 一 个 系统 吞吐 量 的 数学 期 望 值 ， 还 可 以 比较 系统 或 系统 组 件 之 间 
的 相对 吞吐 量 〈 处 理 能 力 ) 。 调 和 平均 值 的 求 值 方法 是 将 各 个 数据 的 倒数 相 加 ， 然 后 用 这 个 求 和 结果 去 
除 取 样 的 数据 元 素数 目 。 数 学 公式 表示 为 : 

H=n (l/rt l/r tl/rst nt 1/ ) 


下 面 考 虑 一 个 简单 的 有 关 汽 车 旅行 的 例子 ， 看 一 下 调和 平均 值 是 如 何 应 用 于 速率 的 。 假 设 我 们 开 
车 旅行 30 英里 ， 前 10 英里 的 速度 是 每 小 时 30 英里 ， 第 二 个 10 英里 的 速度 是 每 小 时 40 英里 ,最 后 10 
英里 的 速度 是 每 小 时 60 英里 。 如 果 对 这 些 速率 进行 算术 平均 ， 那 么 得 到 的 旅行 平均 速度 是 每 小 时 43.3 
英里 。 但 这 显然 是 不 正确 的 。 实 际 上 上 ， 通 过 第 一 个 10 英里 所 需 的 时 间 是 1/3 小 时 。 通 过 第 二 个 10 英 
里 的 耗 时 为 1/4 小 时 ， 而 最 后 10 英里 花费 了 176 小 时 。 旅 行 的 总 计时 间 为 3/4 小 时 ， 由 此 求 出 平均 速 
度 为 30 英里 二 3/4 小 时 = 每 小 时 40 英里 。 调 和 平均 值 就 可 以 非常 简洁 地 给 出 正确 的 结果 : 


3 二 (1/30 十 1/40 十 1/60) = 40 英 下 /小 时 


在 本 例 中 为 了 对 给 定 的 距离 求 出 相关 的 平均 值 ， 我 们 不 得 不 非常 仔细 地 在 旅行 的 经 一 段 行程 中 都 
行驶 相同 的 距离 。 如 果 汽 车 以 每 小 时 60 英里 的 速度 行驶 100 英里 (代替 10 英里) 得 到 的 调和 平均 值 
将 会 是 相同 的 。 调 和 平均 值 并 不 是 告诉 我 们 完成 了 多 少 工作 ， 面 仪 仪 是 完成 的 这 项 工作 的 平均 速率 。 

调和 平均 值 与 几何 平均 值 相 比 有 两 个 优点 。 首 先 ， 调 和 平均 值 是 一 个 非常 合适 的 计算 机 行为 预测 
和 工具。 因此， 调和 平均 值 的 结果 在 性 能 比较 的 范围 之 外 也 很 有 用 。 其 次 ， 耗 时 较 多 的 程序 比 耗 时 较 少 
的 程序 对 调和 平均 值 的 影响 更 大 。 这 个 事实 不 仅 对 “快速 调整 〈quick fix)” 优 化 过 程 有 影响 ， 也 同样 
反应 系统 的 真实 情况 。 大 而 慢 的 任务 比 小 而 快 的 任务 可 能 会 消耗 更 多 的 机 器 周期 。 因 此 ， 加 速 大 而 慢 
的 任务 可 以 获得 更 大 的 机 器 性 能 的 改善 。 

与 几何 平均 值 一 样 , 铀 和 平均 值 也 可 以 采用 相对 性 能 的 比值 形式 。 但 是 ,调和 平均 值 对 参 汶 机 器 
的 选择 更 加 敏感 。 换 句 话 说， 调和 平均 值 的 比值 不 像 几 何平 均值 那样 ， 对 于 不 同 的 参考 机 器 都 是 一 致 
的 。 然 而 ， 在 利用 几何 平均 值 比较 机 器 的 性 能 之 前 ， 必 须 建 立 所 谓 “ 作 业 (work)” 的 定义 。 在 本 章 的 
后 面部 分 ， 读 者 将 会 看 到 这 是 一 种 非常 含糊 的 思想 。 

刚才 我 们 利用 一 个 旅行 的 例子 证 明了 算术 平均 值 不 适合 用 来 描述 平均 速率 问题 。 采 用 归 一 化 表示 
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的 算术 平均 值 结果 同样 也 是 不 正确 的 。 表 10-6 总 结 了 各 种 平均 值 方法 的 正确 应 用 范围 。 
表 10-6 数据 特性 和 所 适用 的 平均 值 方 法 

















偶尔 ， 我 们 会 在 一 些 最 不 希望 看 到 的 地 方 发 现 误 用 统计 方法 的 情形 。 平 均值 方法 的 不 正确 应 用 只 
是 在 公正 和 客观 地 评价 计算 机 系统 性 能 方面 所 遇 到 的 几 个 障碍 中 的 一 个 。 


10. 3.2 统计 学 和 语义 学 


人 的 本 性 推动 着 我 们 尽 可 能 以 最 佳 方式 塑造 我 们 自己 和 我 们 的 信念 。 对 于 产品 销售 者 来 说 ， 其 动 
机 完全 是 出 于 自身 的 利益 和 生存 的 需要 。 当 产品 被 一 大 堆 眼 花 练 乱 的 介绍 和 广告 所 包围 时 ， 人 们 很 难 
看 清楚 产品 的 真实 面目 ， 即 使 这 个 产品 是 一 个 非常 好 的 产品 。 知 道 一 些 所 谓 修辞 性 的 逻辑 概念 的 读者 ， 
都 明白 某 些 非常 荡 雇 的 推理 能 够 应 用 在 销售 和 广告 上 。 一 个 经 典 的 例子 就 是 一 个 “在 电视 上 扮演 医生 ” 
的 演员 为 某 种 令 人 烦恼 的 疾病 推荐 治疗 方法 。 在 修辞 学 的 逻辑 中 ， 这 种 情况 被 称 为 哗众取宠 ， 或 者 说 
是 求助 于 无 资格 的 权威 的 廖 误 。 一 个 演员 ， 除 非 他 还 有 医学 学 位 ， 和 否则 没有 资格 对 任何 疾病 做 出 某 种 
处 理 方案 是 否 合适 的 断言 。 虽 然 ， 演员 “在 电视 上 扮演 计算 机 科学 家 ”来 推介 计算 机 主机 的 情形 并 不 
常见 ， 但 是 某 些 计算 机 供应 商 的 销售 广告 可 以 说 完全 是 一 些 投入 较 好 的 娱乐 内 容 。 

计算 机 购买 者 常常 对 计算 机 销售 资料 上 引用 的 各 种 数字 感到 困惑 。 我 们 已 经 提 到 了 平均 数 是 如 何 
被 误 用 的 。 即 使 采用 了 正确 的 统计 方法 ， 对 许多 人 来 说 这 些 数 字 还 是 不 容易 理解 。 计 算 机 供应 商 通常 
会 提供 一 些 “定量 ”的 信息 数据 ， 使 得 他 们 所 宣称 的 先进 系统 蒙 上 一 层 可 信 的 光环 。 在 第 10. 4 节 中 ， 
我 们 讨论 了 一 些 客观 的 计算 机 性 能 的 度量 方法 。 声 誉 好 的 计算 机 供应 商都 会 正确 地 引用 这 些 度量 结果 。 
但 是 ， 即 使 是 一 种 优秀 的 度量 机 制 也 会 被 误 用 。 在 本 节 的 后 面部 分 ， 我 们 将 介绍 三 种 非常 流行 的 带 有 
修辞 色彩 的 廖 论 ， 这 些 廖 论 可 能 是 读者 在 购买 新 计算 机 硬件 或 系统 软件 时 曾经 遇 到 的 。 





在 2002 年 早期， 一 些 主要 的 商业 和 销售 杂志 上 都 有 一 个 整 页 的 广告 ,广告 的 主要 内 容 是 , “我 们 
已 经 为 我 们 的 产品 进行 一 个 测试 ， 并 公布 了 测试 结果 。X 公司 却 没有 发 表 他 们 产品 的 相同 测试 的 结果 ， 
因此 ， 我 们 的 产品 速度 更 快 ”。 我 们 真正 知道 的 一 切 只 不 过 是 这 个 广告 中 引用 的 统计 数字 ， 有 关 这 些 产 
品 的 相对 性 能 却 未 提 及 。 

有 时 ， 不 完整 信息 的 欺骗 性 也 可 能 采取 这 样 的 形式 ， 即 系统 供应 商 所 引用 的 信息 只 是 一 些 比较 好 的 
测试 结果 ， 而 不 会 提 及 在 同一 时 间 同 一 系统 上 得 到 的 不 太 有 利 的 结果 。 这 种 情况 的 一 个 例子 就 是 采用 
“单一 品质 因素 (single figure of merib”。 系 统 供应 商 关心 的 只 是 在 市 场 上 比 其 竞争 产品 更 具有 优势 的 单 
个 品质 因素 。 实 际 上 ， 这 些 单个 的 度量 标准 并 不 能 代表 正在 讨论 的 系统 的 实际 工作 量 。 不 完整 信息 表现 
的 另外 一 种 方式 是 系统 供应 商 只 引用 “最 高 ”的 性 能 参数 ， 而 忽略 平均 参数 或 者 是 更 一 般 的 情况 。 





de 
和 类 似 不 精确 的 词语 ， 通 常 应 该 立刻 引起 警惕 。 如 果 这 些 词 语 有 一 些 适 当 的 数据 支持 ， 那 么 它们 的 使 
用 可 能 是 合理 的 。 然 而 ， 敏 感 的 读者 可 能 知道 “差不多 ”可 以 意味 着 在 产品 A 和 产品 B 的 性 能 之 间 
“只 不 过 ”有 50% 的 区 别 。 
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一 个 最 近 的 广告 小 册子 就 使 用 了 一 些 不 适当 和 不 可 比 的 度量 方法 所 得 到 的 一 种 不 准确 结果 来 宣传 
某 个 特定 品牌 的 系统 软件 。 广 告 传单 上 的 内 容 大 概 说 ,“ 测 试 中 ， 使 用 Text X 运行 了 软件 A 和 软件 B。 
我 们 有 软件 B 运行 Test Y 的 结果 。 结 果 证 明 ，Test X 和 Test Y 几乎 等 价 。 由 此 ， 可 以 得 出 结论 软件 
A 更 快 一 些 .” 到 底 Test X 和 Test Y 有 多 少 不 等 价 呢 ? 是 否 有 可 能 Test X 的 设计 是 为 了 使 软件 A 看 
起 来 更 好 呢 ? 在 这 种 情况 下 ， 读 者 看 到 的 不 仅 是 〈 可 能 收 到 好 处 ) 广告 作者 在 比较 苹果 和 桔子 ， 而 且 





下 面 的 这 种 廖 误 (欺骗 性 ) 是 目前 为 止 最 为 普遍 的 ， 通 常 也 是 最 难 抵御 的 ， 特 别 是 在 大 量 采购 时 
(例如 计算 机 采购 委员 会 )。 这 种 策略 就 是 ,“ 百 分 之 X 的 美国 财富 杂志 排名 500 强 的 大 公司 使 用 我 们 的 产 
品 。 这 通常 是 一 个 难以 抗拒 的 事实 ， 它 显示 该 公司 构建 很 好 ， 并 且 可 能 比较 稳定 和 值得 信赖 。 这 些 非 定 
量 的 考虑 在 系统 和 软件 选择 方面 的 确 是 非常 重要 的 因素 。 然 而 ， 正 因为 百 分 之 X 的 美国 财富 杂志 排名 
500 强 的 公司 使 用 这 个 产品 ,但 是 并 不 意味 着 这 个 产品 也 适合 于 你 的 公司 。 这 是 一 件 复杂 得 多 的 事情 。 


10.4 基准 


性 能 基准 是 一 个 系统 相对 于 另 一 个 系统 做 出 客观 的 性 能 评价 的 一 门 科学 。 基 准 对 于 评价 通过 升级 
计算 机 或 升级 计算 机 部 件 获得 的 性 能 改进 同样 是 非常 有 用 的 。 好 的 基准 可 以 让 读者 看 穿 广告 宣传 和 误 
用 统计 数字 的 伎俩 。 最 后 ， 好 的 基准 也 有 助 于 读者 辨别 在 合理 的 价格 内 可 以 提供 最 好 性 能 的 系统 。 

在 做 完 仔细 的 采购 之 后 ， 什 么 是 “合理 ”价格 的 问题 通常 都 是 不 言 而 喻 的 。 然 而 ,“ 好 ”的 性 能 却 
是 很 难 懂 的 ， 几 十 年 来 都 很 难 有 一 个 好 的 定义 。 但 是 ， 好 的 性 能 是 “看 了 就 知道 ”的 事情 ， 而 差 的 性 
能 则 在 问题 得 到 纠正 之 前 肯定 会 让 你 的 生活 痛苦 不 堪 。 简 单 地 说 ， 如 果 一 个 计算 机 系统 能 够 使 用 尽 可 
能 少 的 占用 时 间 (或 时 钟 ) 来 运行 应 用 程序 ， 那 么 该 系统 就 达到 了 一 个 最 佳 性 能 。 当 然 ， 同 样 的 计算 
机 系统 没有 必要 也 能 够 用 最 短 的 可 能 时 间 来 运行 其 他 人 的 应 用 程序 。 

如 果 有 某 种 方法 可 以 按照 单一 的 性 能 参数 ， 或 度量 标准 (metric) 来 对 计算 机 系统 进行 分 类 ， 那 
么 购买 计算 机 的 用 户 就 会 变 得 轻松 很 多 。 这 种 方法 的 显著 优点 是 很 少 或 不 懂 计 算 机 的 客户 也 可 以 知道 
他 所 支付 的 金钱 得 到 了 多 少 价值 。 如 果 存 在 一 种 简单 的 度量 标准 ， 我 们 可 以 使 用 性 价 比 (price-per- 
formance ratio) 来 指示 郧 个 系统 是 最 佳 的 购买 选择 。 

例如 ， 我 们 定义 一 个 称 为 “zing” 的 虚构 的 全 包含 的 度量 标准 。 用 150 000 美元 购买 一 个 能 够 提供 
150zing 系统 会 比 用 125 000 美元 购买 一 个 提供 120zing 的 系统 要 好 一 些 。 

第 一 个 系统 的 性 价 比 为 : 


150 000 美元 _ 1 000 美元 
150zings zing 


第 二 个 系统 的 性 价 比 为 : 


125 000 美元 _1 042 美元 
120zings zing 


现在 的 问题 就 变 成 了 我 们 是 否 能 够 为 了 节省 25 000 美元 而 忍受 120 zing 的 系统 ， 还 是 购买 “大 的 经 
济 型 ”的 系统 。 当 然 ， 我 们 知道 要 完全 利用 这 个 “大 的 经 济 型 ”系统 的 资源 容量 还 需要 有 一 段 时 间 。 

这 种 方法 的 困难 在 于 目前 还 没有 一 种 类 似 于 “zing” 的 通用 的 计算 机 性 能 的 度量 ， 而 且 要 求 这 种 
度量 方法 可 以 应 用 于 各 种 工作 负荷 下 的 所 有 系统 上 。 所 以 ， 如 果 我 们 寻找 的 是 一 个 能 够 应 对 〈LO 约 
束 ) 高 事务 处 理 的 系统 ， 例 如 飞机 的 订 票 系统 ， 那 么 应 该 更 关心 /O 性 能 而 不 是 CPU 速度 。 类 似 地 ， 
如 果 系统 的 主要 任务 是 计算 强度 很 高 的 应 用 程序 (CPU 约束 )， 例 如 天 气 预报 或 计算 机 辅助 绘图 等 ， 
那么 主要 注意 力 应 该 放 在 CPU 的 处 理 能 力 上 ， 而 不 是 7O。 


10. 4. 1 时 钟 速 率 、MiPS 和 FLOPS 
CPU 的 速度 本 身 就 是 一 个 会 误导 人 的 度量 标准 。 非 常 不 幸 的 是 ， 计 算 机 商家 经 常 使 用 这 个 度量 标 
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准 来 吹 趴 自己 的 系统 肯定 要 比 其 他 系统 优越 。 在 体系 结构 相同 的 系统 中 ， 如 果 一 个 CPU 以 2 倍 于 另 一 
个 CPU 的 时 钟 速度 运行 ， 那 它 可 能 会 有 更 好 的 CPU 处 理 能 力 。 但 是 ， 人 们 在 比较 不 同 商 家 提供 的 产 
品 时 ， 系 统 的 体系 结构 可 能 是 不 一 样 的 。 否 则 ， 这 些 商 家 都 可 不 能 声称 比 对 方 更 有 竞争 上 的 性 能 优势 。 

一 个 被 广泛 引用 的 ， 与 时 钟 速率 有 关 的 度量 标准 是 每 秒 钟 执行 的 百 万 条 指令 数 (millions of in- 
structions per second，MIPS) 。 然 而 ,许多 人 都 以 为 MIPS 实际 代表 的 意思 是 “针对 销售 人 员 的 毫 无 意 
义 的 性 能 指标 “Meaningless Indicator of Performance for Salesmen)”。 这 个 度量 标准 测量 的 是 某 个 系统 
执行 一 个 典型 的 浮 点 、 整 数 和 逻辑 操作 的 组 合 的 速率 。 需 要 再 次 强调 的 是 ， 使 用 这 种 度量 标准 的 最 大 
问题 是 不 同 的 计算 机 体系 结构 通常 需要 用 不 同 的 机 器 周期 数目 来 执行 一 个 给 定 的 任务 。MIPS 的 度量 
标准 并 没有 考虑 到 完成 一 个 特定 任务 需要 多 少 条 指令 数目 。 

在 对 RISC 系统 和 CISC 系统 进行 比较 时 ， 我 们 不 难看 到 这 种 最 鲜明 的 对 比 。 假 如 让 这 两 种 系统 都 
执行 一 个 整数 除法 操作 。CISC 系统 可 能 只 需要 执行 20 条 二 进 制 机 器 指令 就 可 以 得 出 计算 结果 。 而 
RISC 系统 则 可 能 需要 执行 60 条 指令 。 如 果 这 两 个 系统 都 在 一 秒 钟 内 得 出 答案 ， 那么 RISC 机 器 的 
MIPS 的 等 级 将 会 是 CISC 系统 的 三 倍 。 这 能 够 公正 地 说 明 RISC 系统 比 CISC 系统 快 三 倍 吗 ? 当然 不 
能 ， 内 为 在 这 两 种 情况 下 我 们 都 是 在 一 秒 钟 时 间 内 得 到 答案 。 

使 用 FLOPS 的 度量 标准 中 也 有 类 似 的 问题 。FLOPS 表示 每 秒 钟 执行 的 浮 点 操作 数 《floating- 
point operations per second) 。 百 万 FLOPS (megaflops)， 或 称 为 MFLOPS， 此 度量 标准 最 初 使 用 在 撕 
述 超级 计算 机 的 处 理 能 力 上 ， 但 是 现在 个 人 计算 机 中 也 经 常 引用 。FLOPS 的 度量 标准 比 MIPS 的 度量 
标准 更 加 麻烦 ， 因 为 人 们 在 如 何 组 成 一 个 浮 点 数 操作 上 还 没有 达成 一 致 。 在 第 2 章 中 ,我 们 曾经 解释 
过 计算 机 是 如 何 通过 一 系列 的 部 分 乘积 、 算 术 移 位 和 加 法 操作 来 完成 乘法 和 除法 运算 。 在 每 个 这 些 原 
始 的 操作 过 程 中 ， 都 是 对 浮 点 数 进行 操作 的 。 因 此 ， 难 道 我 们 可 以 说 只 有 计算 一 个 中 间 的 部 分 和 才 是 
一 个 浮 点 操作 吗 ? 如 果 这 样 ， 并 且 我 们 的 度量 标准 是 FLOPS， 那 么 将 会 损害 使 用 高 效 算 法 的 计算 机 供 
应 商家 。 高 效 算法 可 以 使 用 较 少 的 步 又 来 达到 同样 的 结果 。 如 果 要 求 得 答案 所 耗费 的 时 间 与 使 用 效率 
较 低 的 算法 所 需 的 时 间 相 同 ， 那 么 这 个 更 有 效率 的 计算 机 系统 的 FLOPS 速率 会 较 低 。 如 果 我 们 不 打算 
计算 部 分 和 的 加 法 步 又， 那么 如 何 证 明 计算 其 他 浮 点 加 法 操作 是 合理 的 昵 ? 而 且 ， 有 些 计算 机 根本 不 
使 用 浮 点 指令 。 早 期 Cray 超级 计算 机 和 IBM PC 机 都 是 使 用 整数 程序 来 模仿 浮 点 操作 。 因 为 FLOPS 
的 度量 标准 只 考虑 浮 点 操作 ， 如 果 只 是 单独 依赖 于 这 种 度量 标准 ， 则 这 些 计算 机 系统 将 会 变 得 毫 无 价 
值 。 但 是 无 论 如 何 ， 像 MIPS 一 样 ，MFLOPS 是 销售 人 员 采 用 的 一 种 非常 流行 的 度量 机 制 ， 原 因 是 它 
听 起 来 像 是 一 个 “ 硬 ” 价 值 指标 ， 并 且 它 代表 一 种 简单 而 直观 的 概念 。 

尽管 存在 各 种 缺点 ， 但 是 时 钟 速度 、MIPS 和 FLOPS 在 比较 由 相同 的 计算 机 厂家 所 提供 的 一 系列 
相似 计算 机 的 相对 性 能 时 是 很 有 用 的 度量 方法 。 因 此 ， 如 果 一 个 厂家 提供 从 现 有 的 几 个 MIPS 的 系统 
升级 到 2 倍 的 MIPS 的 系统 时 ， 你 所 支付 的 金钱 将 会 得 到 合理 的 性 能 上 的 提升 。 实 际 上 ， 许 多 计算 机 
制造 厂商 为 此 准备 了 他 们 自己 的 一 组 度量 标准 。 有 道德 的 销售 人 员 不 会 用 他 们 自己 公司 拥有 的 专用 度 
量 标 准 来 评价 其 竞争 者 的 系统 。 如 果 使 用 某 个 制造 厂商 的 专用 度量 标准 来 描述 其 竞争 对 手 的 系统 性 能 
时 ， 那 些 潜在 的 客户 将 不 会 知道 ， 这 个 专用 的 度量 标准 是 否 特别 设计 去 关注 某 个 特定 类 型 系统 的 强项 ， 
而 忽略 了 系统 的 弱点 。 

很 显然 ， 任 何 一 个 依赖 于 特定 系统 的 组 织 和 指令 系统 的 度量 标准 都 可 能 忽视 一 些 计 算 机 购买 者 所 
要 寻找 的 东西 。 计 算 机 购买 者 需要 有 一 些 比 较 客 观 的 方法 来 了 解 哪个 系统 能 够 以 最 低 的 价格 为 他 们 的 
工作 提供 最 大 的 处 理 能 力 。 


EE 

在 20 世纪 70 年 代 和 80 年代， 两 大 计算 机 制造 商 ，IBM 和 数字 设备 公司 (DEC) 之 间 展 开 了 激烈 
的 竞争 。 虽然 DEC 公司 不 生产 巨型 机 系统 ， 但 是 它 的 最 大 型 的 计算 机 系统 也 适合 于 使 用 较 小 型 的 IBM 
系统 的 客户 。 

为 了 打开 新 品牌 VAX 11/780 的 市 场 ，DEC 工程 师 在 IBM 370/158 和 他 们 的 VAX 上 运行 一 些小 
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的 综合 基准 程序 。IBM 公司 传统 上 将 370/158 作为 “1 MIPS” 的 机 器 进行 销售 。 因 此 ， 当 基准 程序 在 
VAX 11/780 机 器 上 耗费 相同 的 时 间 时 ，DEC 公司 就 开始 将 他 们 的 系统 作为 一 个 具有 竞争 力 的 
“1 MIPS” 系 统销 售 。 

在 商业 上 ，VAX 11/780 是 一 个 很 成 功 的 产品 。 这 个 系统 非常 流行 以 至 于 后 来 变 成 标准 的 1 MIPS 
系统 。 许 多 年 来 ，VAX 11/780 曾经 是 大 量 基 准 测试 的 参考 系统 。 这 些 基准 测试 的 结果 可 以 为 任何 被 
测试 的 系统 得 出 一 个 “近似 的 MIPS” 等 级 。 

毫 无 疑问 ，VAX 11/780 的 计算 能 力 和 IBM 370/158 的 计算 能 力 相 当 。 但 是 ，VAX 11/780 还 需要 
经 过 严格 的 审查 才能 被 冠 以 “1 MIPS” 机 器 的 概念 。 测 试 的 结果 表明 ， 由 于 特殊 的 指令 系统 ，VAX 
11/780 这 个 机 器 运行 基准 程序 时 仅 执行 了 大 约 500 000 个 机 器 指令 。 因 此 ， 事实 上 ， 这 个 所 谓 的 
“1 MIPS 标 准 系统 ”根本 就 只 是 一 个 0. 5 MIPS 的 系统 。 后 来 ，DEC 公司 通过 指定 的 VUP (VAX 机 器 
的 性 能 ，vax unit of performance) 来 宣传 其 计算 机 系统 ，VUP 实际 上 指出 系统 与 VAX11/780 机 器 的 
相对 速度 。 |] 


10. 4.2 综合 基准 : Whetstone、Linpack 和 Dhrystone 


很 入 以 来 ,计算 机 研究 人 员 一 直 在 寻找 一 种 单一 的 基准 。 这 种 基准 可 以 独立 于 任意 类 型 的 计算 机 
组 成 原理 和 体系 结构 来 进行 公平 和 可 靠 的 性 能 比较 。 和 寻求 一 个 理想 的 性 能 度量 工具 最 早 开始 于 20 世纪 | 
80 年 代 晚 期 。 这 个 时 期 流行 的 观点 是 人 们 可 以 通过 一 个 标准 化 的 基准 应 用 程序 来 独立 地 比较 许多 不 同 
系统 的 性 能 。 由 此 得 出 的 结论 就 是 ， 人 们 可 以 用 第 三 代 语 第 (例如 C 请 言 ) 编写 一 个 程序 ， 在 不 同 的 
系统 上 编译 和 运行 这 个 程序 ， 然 后 测试 在 不 同系 统 上 每 次 运行 该 程序 所 需 的 时 间 。 这 种 测试 结果 的 执 
行 时 间作 为 所 有 被 测试 系统 的 一 个 单一 的 性 能 度量 标准 。 源 于 这 种 方式 的 性 能 度量 标准 被 称 为 综合 基 
准 〈syntbetic benchmarks)， 因 为 它们 并 不 需要 代表 某 些 特定 的 工作 量 或 应 用 程序 。 其 中 ， 三 种 比较 
知名 的 综合 基准 是 Whetstone、Linpack 和 Dhrystone 度量 标准 。 

1976 年 ， 英 国 国家 物理 实验 室 的 Harold J. Curnow 和 Brian A. Wichman Whetstone 发 表 了 Wher- 
stone 基准 程序 。Whetstone 基准 是 强调 浮 点 计算 的 ， 还 有 许多 计算 三 角 函 数 和 指数 函数 的 库 子 程序 的 
调用 。 测 试 结果 用 每 秒 执行 1 000 条 Whetstone 指令 (KWIPS) 或 每 秒 执行 1 兆 条 Whetstone 指令 
(MWIPS) 来 表示 。 

另 一 种 用 于 淫 点 性 能 测试 是 Linpack 基准 。Linpack 是 线性 代数 程序 包 (LIHNear algebra PACK- 
age) 的 缩写 ， 这 是 一 个 被 称 为 基本 线性 代数 子 程序 (Basic Linear Algebra Subroutines，BLAS) 的 子 
程序 的 集合 ， 它 使 用 双 精 度 算术 来 求解 线性 方程 系统 。1984 年 ， 美 国 Argonne 国家 实验 室 的 Jack 
Dongarra、Jim Bunch、Cleve Moler 和 Pete Stewart 为 了 测试 超级 计算 机 的 性 能 开发 了 Linpack 基准 。 
开始 ，Linpack 基准 使 用 FORTRAN 77 语言 来 编写 ， 后 来 又 使 用 C 语言 和 Java 语言 。 尽 管 存在 一 些 严 
重 的 缺陷 ， 但 是 Linpack 的 一 个 很 好 的 方面 就 是 为 FLOPS 设立 了 一 种 标准 的 度量 方法 。 即 使 对 于 一 个 
根本 没有 浮 点 运算 电路 的 系统 ， 如 果 它 能 够 正确 执行 Linpack 基准 程序 ,那么 它 也 可 以 获得 FLOPS 等 
级 评定 。 

高 速 浮 点 计算 肯定 不 会 对 每 个 用 户 都 很 重要 。 意 识 到 这 个 问题 之 后 ， 西 门 子 尼克 道夫 〈Siemens 
Nixdorf) 信息 系统 公司 的 Reinhold P. Weicker 在 1984 年 编写 了 一 个 基准 程序 ， 这 个 基准 程序 主要 关 
心 的 是 字符 串 处 理 和 整数 操作 。 他 把 这 个 程序 称 为 Dhrystone 基准 ， 据 称 是 作为 Whetstone 基准 的 一 
个 双关 语 。 这 个 程序 是 CPU 约束 的 ,不 需要 执行 I/0 或 系统 调用 。 不 像 WIPS，Dhrystone 基准 的 结 
果 简 单 地 用 每 秒 的 Dhrystone 数 来 表示 ， 在 一 秒 内 测试 程序 运行 的 次 数 ， 而 不 是 用 DIPS 或 Mega-DIPS 
来 表示 。 

Whetstone、Linpack 和 Dhrystone 基准 程序 在 算法 和 报告 的 结果 方面 都 具有 简单 和 易于 理解 的 优 
点 。 不 幸 的 是 ， 这 也 正 是 它们 的 主要 限制 。 因 为 这 些 程 序 的 各 种 操作 都 有 非常 清晰 的 定义 ， 所 以 对 于 
编译 器 的 编写 者 来 说 ， 可 以 很 容易 在 他 们 的 产品 上 装备 带 有 “Whetstone”、“Linpack” 或 “Dhrys- 
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tone” 的 编辑 开关 。 当 具有 这 些 设置 时 ， 这 些 编译 器 的 选择 项 就 会 调用 为 基准 程序 编写 的 专用 的 被 优 
化 的 程序 代码 。 而 且 ， 被 编译 对 象 很 小 ， 以 至 于 程序 的 绝 大 部 分 都 可 以 驻 留 在 现在 的 计算 机 系统 的 高 
速 缓存 中 。 这 样 一 来 ， 也 就 失去 了 评价 一 个 系统 的 存储 器 的 管理 能 力 的 机 会 。 

运行 基准 程序 是 一 种 实践 惯例 ， 它 和 综合 基准 本 身 一 样 历 史 悠久 。 人 们 利用 基准 来 设计 各 种 编译 
器 和 计算 机 系统 ， 就 是 为 了 获得 最 佳 的 系统 功能 。 只 要 发 布 一 个 好 的 测试 结果 数据 可 以 带 来 经 济 利益 
时 ， 计算机 制造 商都 会 不 遗 余 力 地 使 他 们 的 数字 看 起 来 非常 好 。 如 果 测 试 数据 比 竞争 者 的 结果 更 好 ， 
那么 他 们 立刻 就 会 做 广告 宣传 他 们 的 “优势 ”系统 。 这 种 广泛 流行 的 做 法 已 经 变 成 了 著名 的 基准 方法 
(benchmarking) 。 当 然 ， 不 管 这 些 数据 有 多 好 ， 基 准 测试 的 结果 实际 上 只 能 告诉 我 们 一 件 事 ， 即 被 测 
试 的 系统 运行 这 个 基准 程序 有 多 好 。 但 是 ， 这 些 数据 绝 不 会 告诉 我 们 运行 其 他 程序 方面 的 情况 ， 特 别 
是 我 们 所 需 的 特定 的 工作 量 。 


10. 4.3 标准 性 能 评估 公司 基准 


计算 机 性 能 度量 科学 大 大 受益 于 Whetstone、Linpack 和 Dhrystone 基准 所 做 的 贡献 。 一 方面 ， 这 
些 程序 给 出 了 一 种 有 价值 的 思想 ， 即 有 一 个 通用 的 标准 ， 所 有 系统 都 可 以 通过 这 个 通用 标准 进行 比较 。 
更 重要 的 是 ， 虽 然 是 无 意识 的 ， 但 这 些 基 准 证 明了 当 一 个 精心 设计 的 测量 基准 又 小 又 简单 时 ， 对 于 计 
算 机 的 制造 三 商 来 说 ， 优 化 他 们 的 产品 性 能 变 得 非常 容易 。 很 显然 ， 解 决 这 个 问题 的 办 法 就 是 设计 一 
种 更 加 复杂 的 ， 但 是 同样 能 够 提供 一 些 易于 理解 的 结果 的 基准 。 这 就 是 SPEC CPU 基准 的 目标 。 

标准 性 能 评估 公司 (SPEC，Standard Performance Evaluation Corporation) 成 立 于 1988 年 ， 是 由 
一 个 计算 机 制造 商 协会 和 电气 工程 时 代 杂 志 (Electrical Engineering Times) 合作 创建 的 。SPEC 的 主 
要 目标 是 为 计算 机 的 性 能 度量 建立 一 些 公 正和 实际 的 方法 。 今天， 这 个 组 织 包括 超过 60 家 的 会 员 公司 
和 3 家 分 支 委 员 会 。 这 些 委员 会 是 : 

“开放 系统 小 组 〈OSG) ， 主 要 从 事 有 关 工 作 站 、 文 件 服务 器 和 桌面 计算 环境 方面 的 工作 。 

。 高 性 能 小 组 (HPG)， 主 要 关心 企业 级 多 处 理 器 和 超级 计算 机 。 

* 图形 性 能 特性 小 组 (GPC) ， 主 要 致力 于 多 媒体 和 高 密度 图 形 系统 。 

这 些 组 织 同 计算 机 用 户 一 起 工作 ， 确 定 一 些 能 够 代表 典型 工作 量 的 程序 ， 或 者 是 能 够 从 许多 系统 
中 区 分 出 一 个 优越 系统 的 应 用 程序 。 如 果 将 IO 的 例 行 程序 和 其 他 非 CPU 密集 型 的 程序 代码 从 这 些 应 
用 程序 中 剔除 出 来 ， 那 么 最 后 得 到 的 结果 程序 称 为 内 核 〈kernel) 。SPEC 委员 会 仔细 地 从 不 同 的 应 用 
团体 提交 的 程序 中 挑选 出 内 核 程序 。 最 后 选择 的 内 核 程 序 集合 称 为 上 基准 套件 〈benchmark suite) 。 

SPEC 基准 中 最 著名 的 〈 和 受 人 尊敬 的 ) 是 SPEC 的 CPU 套件 ， 它 可 以 用 来 测试 CPU 的 吞吐 量 ， 
高 速 缓存 和 存储 器 的 访问 速度 ， 以 及 编译 器 的 效率 。 这 个 基准 的 最 新 版 本 是 CPU2000，CPU2004 的 版 
本 现在 正在 开发 中 。CPU2000 包括 两 个 部 分 ，CINT 2000 和 CFP2000。CINT 2000 用 来 评测 系统 执行 
整数 处 理 的 能 力 ， 而 CFP2000 用 来 评测 CPU 的 浮 点 运算 性 能 (参见 表 10-7)。CINT 和 CFP 中 的 “C” 
代表 “组 件 (component)”， 这 个 名 称 强调 了 这 些 基 准 仅 仅 测 试 系统 中 的 一 个 组 件 。 

CINT 2000 由 12 个 应 用 程序 组 成 。 其 中 ，11 个 应 用 程序 是 用 C 语言 编写 的 ， 另 外 1 个 是 用 C+ 十 
语言 编写 的 。CFP2000 套件 由 14 个 应 用 程序 组 成 ， 其 中 的 6 个 采用 FORTRAN 77 编写 ，4 个 用 FOR- 
TRAN 90 编写 ,另外 4 个 用 C 语 言 编写 。 这 些 结果 (系统 吞吐 量 ) 是 通过 运行 这 些 测试 程序 得 到 的 。 
这 些 结果 表示 为 在 被 测 系统 上 运行 这 个 内 核 所 需 时 间 与 在 参考 机 器 上 运行 这 个 相同 的 内 核 所 需 时 间 的 
比率 。 对 于 CPU2000 来 说 ， 参 考 机 器 是 一 台 带 一 个 300MHz CPU 的 Sun 公司 的 Ultra 10 计算 机 系统 。 
被 测试 的 系统 几乎 可 以 确定 要 比 Sun Ultra 10 系统 快 ， 所 以 可 以 看 到 计算 机 制造 厂家 所 引用 的 测试 结 
果 是 一 些 很 大 的 正 数 。 这 个 数 越 大 ， 性 能 就 越 好 。 在 大 多 数 系统 上 完成 整个 SPEC CPU 2000 套件 的 运 
行 仅 需要 两 天 多 一 点 的 时 间 。 运 行 CINT2000 和 CFP2000 的 报告 结果 是 所 有 组 件 内 核 运行 结果 的 比率 
的 一 个 几何 平均 值 〈 细 节 请 参考 补充 的 “计算 SPEC CPU 基准 ”) 。 
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164. 











压缩 一 个 TIFF (标签 
志 、 二 进 制程 序 代码 、“ 随 机 ”数据 和 tar 文 件 源 程序 









175. 


176. 











表 10-7 SPEC CPU 2000 基准 套件 的 组 成 内 核 
使 用 一 个 组 合 优化 程序 来 映射 〈 绘 图 ) FPGA 电路 的 逻辑 模 


gzip C 压缩 
让 现场 可 编程 门 阵 
14 CG 
小 Me 块 和 需要 的 电路 连接 。 这 些 程序 一 般 是 集成 电路 的 CAD 程序 








181. 


186. 


197: 
252. 


253. perlbmk 
254. 


255. 
256. 


300., 
168. 
171. 
172, 


173. 
127 


178， 
179. 


183. k GC 
nF i 仿真 动 的 历史 


187. facerec 1900 
188. 


189. 
191, 
200. 


301. 





1100 c C 编程 语言 编 利用 gcc 编译 来 自 5 个 不 同 的 输入 源 文件 的 Motorola 
CC 
人 译 器 -| 88100 的 机 器 代码 

C 沪 。 求解 一 个 通常 在 公共 交通 规划 领域 遇 到 的 单一 总 站 的 汽 


f 1800 EE] 

mc 0 组 合 优化 车 调度 问题 

hs | i 二 对 于 可 变 的 搜索 树 “ 深 度 ”求解 5 种 不 同 的 棋盘 输入 布 
局 图 的 可 能 的 下 一 步 走 法 

parser | 1800 文字 处 理 使 用 一 个 60 000 字 的 字典 解析 输入 的 句子 找 出 英语 的 句法 


eon 


C 十 十 计算 机 虚拟 化 使 用 概率 光线 寻 迹 方法 寻找 三 维 光线 的 交汇 点 
PERL 编程 语言 | ”处 理 5 种 Perl 脚本 ， 生 成 邮件 、HTML 和 其 他 输出 
C 


| 群 理论 解释 程序 | ”解释 一 种 编写 的 群 理论 语言 ， 以 处 理 一 些 组 合 逻 辑 问题 


el 从 3 个 面向 对 象 的 数据 库 中 操作 数据 


压缩 一 个 TIFF、 二 进 制程 序 和 tar 类 型 的 源 文件 

在 一 个 微 芯片 上 寻找 一 种 最 佳 晶体 管 布局 问题 的 近似 解 
决 方案 

物理 学 家 在 研究 量子 色 动力 学 中 模拟 夸克 〈quark) 相互 
作用 

使 用 数学 建 模 技术 预测 天 气 。 游 动 (swim) 通常 用 作 超 


人 i 





gap 





二 一 | 一 | 王 
< || 
© QS4 
© ©olo"S 


奴 志 






vortex 








bzip2 





twolf 





wupwisel 


量子 色 动 力学 





swim 





三 维 势 场 的 求 计算 三 维 标量 泊 松 方程 的 求解 问题 。 这 个 内 核 基 准 来 自 


mgrid 解 程序 NAGA 



















抛物 线 -椭圆 型 
1 使 5 个 非 缚 
applu 偏 微分 方程 使 用 稀 朴 雅 可 比 和 矩阵 求解 5 个 非 线 性 的 偏 微分 方程 
mesa 3-D 图 形 库 把 二 维 图 形 输入 转换 成 三 维 图 形 输出 


决定 引起 对 流 流动 转变 为 振动 流动 时 流体 容器 壁 上 温度 
差 的 特征 值 
在 一 幅 图 像 中 找 出 一 个 直升机 和 飞机 的 图 像 ， 这 种 算法 
使 用 神经 网 络 
使 用 有 限 元 分 析 法 从 一 次 地 震 事件 的 结果 来 恢复 地 表 运 


galgel 








art 








使 用 “弹性 图 形 匹 配 ” 方 法 来 识别 由 加 标示 图 形 描述 的 

面部 

ammp 通过 计算 一 个 系统 中 的 分 子 运动 来 求解 分 子 动力 学 问题 
开始 一 个 确定 某 个 大 Mersenne 数字 (2? :) 的 初始 状 
态 的 过 程 。 这 个 结果 找 不 到 ， 因 而 改 为 测量 中 间 结 果 


00 | FORTRAN 
lucas 
90 
有 限 元 撞击 仿真 仿真 非 弹性 的 三 维 固体 碰撞 效果 


ixtiacl| 1100 | FORTRAN | 高 能 核 物理 加 | 仿真 通过 一 个 粒子 加 速 器 的 粒子 轨迹 行为 
77 | 速 器 设计 
FORTRAN | 人 利用 初始 速度 、 风 速 和 温度 等 参数 来 求解 离开 一 个 固定 
77 源 的 污染 物 粒子 的 速度 
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由 于 系统 销售 非常 依赖 于 有 利 的 基准 结果 ， 所 以 人 们 不 难 想到 计算 机 制造 厂商 会 竭尽 所 能 寻找 各 
种 欺骗 应 对 SPEC 规则 的 方法 来 运行 这 些 基 准 程序 。 第 一 种 伎俩 就 是 使 用 编译 器 的 “基准 开关 ”， 这 种 
方法 在 Whetstone、Linpack 和 Dhrystone 基准 程序 上 已 经 变 成 惯例 。 然 而 ， 为 了 使 用 SPEC 套件 ， 要 
找到 一 组 完美 的 编译 器 选择 并 不 像 在 早期 的 综合 基准 中 那样 简单 。 为 了 优化 套件 中 的 每 个 内 核 ， 通 常 
需要 有 不 同 的 设置 ， 并 且 要 找到 这 些 设置 方法 是 一 件 非 常 耗 时 和 沉闷 的 工作 。 

在 发 布 CPU95 套件 之 前 ，SPEC 开始 意识 到 这 种 使 用 “基准 专用 的 ”编译 器 选择 的 情况 。SPEC 
尝试 要 终结 这 种 基准 专用 编译 器 ， 具 体 做 法 是 强制 要 求 套件 中 所 有 使 用 相同 语言 编写 的 程序 都 必须 使 
用 具有 相间 组 的 编译 器 标志 来 进行 编译 。 这 种 做 法 立即 招致 制造 厂商 方面 的 批评 ， 他 们 争辩 说 客户 有 
权 知 道 一 个 系统 可 能 达到 的 最 佳 性 能 。 而 且 ， 如 果 客 户 的 应 用 程序 和 其 中 的 一 个 内 核 程序 相似 的 话 ， 
那么 客户 会 由 于 知道 最 佳 的 编译 器 选择 而 从 中 大 大 受益 。 

这 些 批评 足以 驱使 SPEC 允许 套件 中 的 每 个 程序 都 使 用 不 同 的 编译 器 标志 。 然 而 ， 为 了 对 大 家 都 
公平 起 见 ， 计 算 机 制造 厂商 们 会 为 SPEC CPU 2000 公布 两 组 测试 结果 。 其 中 一 组 结果 是 对 于 整个 基准 
套件 测试 所 有 的 编译 器 设置 中 有 哪些 相同 的 地 方 〈 称 为 基础 度量 标准 )， 第 二 组 结果 是 给 出 通过 优化 的 
设置 所 获得 的 结果 〈 即 最 高 度量 标准 )。 在 基准 编译 过 程 中 的 两 种 结果 数字 都 需要 进行 报告 ， 并 且 在 每 
次 运行 时 要 完全 公开 这 些 编 译 器 设置 。 

SPEC 基准 程序 的 用 户 需要 为 基准 套件 的 源 代 码 和 指令 的 安装 和 编译 支付 一 定 的 管理 费用 。 而 且 ， 
SPEC 还 鼓励 制造 厂家 〈 不 是 必需 的 ) 提交 一 份 包括 基准 测试 的 结果 报告 ， 供 SPEC 进行 评估 检查 。 如 
果 这 些 测试 是 按照 SPEC 的 指导 方针 运行 ， 并 且 SPEC 对 这 些 测 试 结果 表示 满意 ， 那 么 SPEC 会 在 其 
网 站 上 发 布 这 些 基 准 测试 的 结果 并 公开 这 些 配置 报告 。SPEC 会 十 分 仔细 地 确保 计算 机 制造 厂商 已 经 
正确 地 使 用 这 些 基 准 软件 ， 并 且 保 证 完全 公开 这 些 系统 的 配置 情况 。 

虽然 处 理 器 制造 厂商 之 间 的 激烈 竞争 引发 了 大 量 的 计算 机 商业 新 闻 报 道 ， 但 是 Amdahl 规律 告诉 我 
们 ， 有 用 的 计算 机 系统 所 需要 的 不 仅仅 是 一 个 快速 的 CPU。 计 算 机 的 购买 者 感 兴 趣 的 往往 是 整个 系统 在 
它们 自己 特定 的 任务 负载 下 的 工作 性 能 。 针 对 这 种 情况 ，SPEC 还 创建 了 一 系列 其 他 度量 标准 ， 包括 
Web 服务 器 使 用 的 SPEC Web， 高 性 能 计算 机 的 使 用 SPEC HPC， 以 及 测试 客户 端 Java 性 能 的 SPEC 
JVM。SPEC JVM 是 测试 Java 服务 器 性 能 时 使 用 的 SPEC JBB (Java Business Benchmark，jJava 商业 基准 ) 
的 补充 。SPEC 的 每 一 个 基准 都 坚持 了 SPEC 要 建立 公正 和 客观 的 系统 性 能 度量 的 思想 。 图 





在 本 书 中 我 们 曾经 讲 到 ， 计 算 SPEC 基准 结果 的 第 一 步 是 将 一 台 基 准 内 核 在 一 台 参 考 机 器 上 运行 
所 需 的 时 间 归 一 化 到 相同 的 内 核 在 被 测试 系统 上 运行 所 表 10-8 一 组 假想 的 SPECint 结果 集合 












































花费 的 时 间 上 。 这 种 归 一 化 的 结果 是 一 个 简单 的 比值 ， | | 名 考 机 疝 - 
然后 把 这 个 比值 乘 以 100。 例 如 ， 如 果 有 一 个 假想 的 系 。 基 准 | 参考 时 间 | 运行 时 间 | 的 比率 
统 在 476 秒 时 间 内 完成 了 164. gzip 内 核 运行 ， 而 参考 机 “164 gaip 1400 | 47 | 264 
器 运行 这 个 相同 的 程序 所 花费 的 时 间 是 1400 秒 。 那 么 175. vpr 1400 437 320 
归 一 化 的 时 间 比 率 为 ，1400 二 476X100 二 294 (截取 整 ” 176. gece | li00 | 342 | 322 
数 )。 最 后 的 SPECint 的 整数 性 能 的 结果 是 在 整个 整数 181. mcf 1800 687 | 262 
程序 套件 中 所 有 的 归 一 化 比率 的 几何 平均 值 。 计 算 结果 186.crafty | 100 | 325 | 308 
如 表 10-8 所 示 。 197. parser 1800 759 | 237 
要 决定 这 个 几何 平均 值 ， 必 须 首先 求 出 所 有 12 个 232eom | 130 | 461 | 282 
归 一 化 基准 时 间 的 乘积 ， 253. perlbmk 1800 823 219 
294X320X322 X262X 308X 237 X282 X 219X 245 254 gap 1100 J 449 | 245 
255, vortex 1900 686 277 
X277X318X581 xz 4.48X1029 ex | 
然后 计算 这 个 乘积 的 12 次 方 根 ; | 256, bzip2 1500 472 318 
(4. 48X 1029) /na 296 300. twolf EN 516 581 
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因此 ， 这 个 系统 (有 一 种 公平 的 感觉 的 CINT 度量 标准 的 结果 为 296。 如 果 这 个 结果 是 在 运行 利 
用 标准 的 (也 是 比较 保守 的 ) 编译 器 设置 所 编译 过 的 基准 程序 时 得 到 的 ， 那么 这 个 结果 将 会 作为 一 个 
“基础 ”的 度量 标准 SPECint _ base _ 2000 来 报告 。 否 则 ， 这 个 结果 就 是 这 个 系统 的 SPECint 2000 评价 
的 结果 。 

当 每 次 只 运行 每 个 基准 程序 的 一 个 版 本 映像 时 ，CINT2000 套件 和 CFP2000 套件 测量 的 是 CPU 的 
性 能 。 但 是 ， 这 个 单线 程 模型 不 能 告诉 我 们 系统 处 理 并 发 进程 的 能 力 好 坏 。SPEC CPU “速率 (rate)” 
的 度量 方法 在 这 里 会 给 我 们 一 些 启 示 。 计 算 SPECint _ rate 的 度量 方法 比 计算 单线 程 SPECint 度量 方 
法 要 稍微 复杂 一 些 。 

为 了 找到 一 种 速率 的 度量 机 制 ， 可 以 在 主机 系统 中 启动 若干 个 完全 相同 的 基准 内 核 程 序 进程 。 针 
对 上 面 的 例子 ， 我 们 启动 4 个 并 发 的 164. gzip 进程 。 在 所 有 164. gzip 程序 实例 终止 后 ， 通 过 把 最 后 一 
个 实例 的 完成 时 间 减 去 第 一 个 实例 开始 的 时 间 ， 得 到 这 4 个 并 发 进程 所 消耗 的 时 间 。 假 设 该 时 间 差 为 
450 秒 。 用 这 个 时 间 去 除 3600 秒 得 到 “每 小 时 的 运行 数 ” 的 比率 ， 结 果 就 是 : 


接 下 来 考虑 套件 中 最 大 的 参考 时 间 ， 即 浮 点 套件 中 的 171, swim 基准 程序 ， 把 它 归 一 化 到 基准 程 
序 的 参考 时 间 。164. gzip 的 归 一 化 数字 大 约 为 ， 


1400 
3100 0.45161 


把 这 两 个 数字 与 运行 进程 的 副本 数目 相 乘 就 得 到 这 个 基准 程序 的 SPECint _ rate2000 度量 标准 。 
因为 这 里 运行 了 4 个 基准 程序 的 副本 ， 所 以 有 (截取 到 一 位 小 数 ) : 

4X8X0.45161 一 14,. 5 

这 里 要 报告 的 该 系统 的 SPECint _rate2000 度量 标准 是 所 有 CINT2000 组 件 的 内 核 的 几何 平均 值 。 
当然 ， 可 以 利用 相同 的 过 程 来 确定 SPECfp _ rate 的 结果 。 国 


10.4.4 事务 性 能 委员 会 基准 


SPEC 基准 对 那些 主要 关心 CPU 性 能 的 计算 机 购买 者 来 说 非常 有 用 。 但 是 ， 他 们 对 于 购买 企业 级 事 
务 处 理 服务 器 的 用 户 来 说 受益 却 没有 那么 大 。 对 于 这 种 类 型 的 系统 来 说 ， 购 买 者 最 感 兴趣 的 是 服务 器 处 
理 大 量 并 发 的 持续 时 间 较 短 的 事务 的 能 力 。 这 里 ， 每 个 事务 都 在 一 定 程度 上 涉及 到 通信 和 磁盘 /0O。 

对 于 商务 活动 来 说 ， 缓 慢 的 事务 处 理 系 统 的 成 本 是 非常 高 吊 的 ， 而 且 会 引发 大 量 的 深层 次 问题 。 
如 果 客 户 服务 系统 的 处 理 速度 很 慢 ， 会 引起 客户 的 不 满 ， 因 而 也 会 影响 到 这 个 零售 商店 的 形象 。 在 结 
账 柜台 前 排 成 长 龙 缓慢 移动 的 顾客 们 并 不 会 关心 信用 卡 的 认证 系统 是 否 出 现 了 麻烦 。 如 果 等 得 太 久 的 
话 ， 和 昏睡 的 自动 取 获 机 和 反应 迟钝 的 收 款 机 会 陆续 地 赶 走 顾 客 。 事 务 处 理 系 统 不 仅仅 对 客户 服务 部 门 
非常 重要 ， 而 且 就 是 企业 生命 所 必须 的 血液 。 精 明 的 商业 领导 人 都 愿意 在 这 方面 投入 少量 的 资金 以 使 
客户 满意 。 因 为 存在 太 多 的 问题 ， 所 以 非常 有 必要 找到 某 些 方法 来 客观 地 评价 支撑 这 些 关键 商业 活动 
的 处 理 系统 的 整体 性 能 。 

通常 ， 计 算 机 的 制造 广 商都 有 测试 自己 的 系统 性 能 的 方法 。 这 些 测量 不 是 为 公众 消费 者 设计 的 ， 
而 是 为 工程 师 内 部 使 用 而 设计 的 ， 工 程 师 使 用 这 些 方法 来 改进 系统 (系统 的 某 些 部 分 的 性 能 。 在 20 
世纪 的 80 年 代 早期 IBM 公司 就 开发 了 一 个 这 样 的 基准 来 帮助 设计 公司 的 大 型 机 系统 。 这 个 基准 ， 被 
称 为 TP1 (TP 即 事 务 管理 )，、 最 终 还 是 进入 了 公用 的 领域 。 许 多 竞争 的 系统 供应 厂家 开始 使 用 这 个 基 
准 并 发 布 他 们 〈 令 人 人 惊异 ) 的 结果 。 事 务 处 理 专家 对 这 种 做 法 表示 不 满 ， 央 为 这 个 基准 并 不 是 设计 用 
来 模仿 真实 的 事务 处 理 环境 。 一 方面 ， 这 个 基准 忽略 了 网 络 延 迟 情况 和 用 户 “ 思 考 时 间 ” 的 可 变性 。 
男 一 方面 , TP1 能 做 的 一 切 只 是 测量 在 理想 条 件 下 的 最 大 处 理 能 力 〈 吞 吐 量 )。 虽 然 这 些 测量 对 于 系统 
设计 师 来 说 很 有 用 ， 但 是 它们 却 不 能 给 计算 机 的 购买 者 们 太 多 的 忠告 。 

1985 年 ， 一 个 著名 的 TP1 的 批评 者 Jim Gray， 和 一 大 群 TP1 的 反对 者 共同 提出 了 一 个 基准 ， 这 
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个 基准 主要 针对 的 是 TP1 的 一 些 缺 点 。 他 们 把 这 个 基准 称 为 DebitCredit， 用 以 强调 它 主 要 用 来 评价 商 
业 事 务 的 处 理性 能 。 除 了 详细 说 明 这 个 基准 工作 原理 外 ，Gray 和 他 的 团队 还 提议 系统 的 测试 结果 应 该 
随同 被 测试 系统 配置 的 总 价格 一 起 报告 。 他 们 还 提供 了 一 些 方法 可 以 按 比 例 地 缩放 这 种 基准 程序 ， 这 
样 使 得 这 些 测 试 对 各 种 不 同 大 小 的 系统 来 说 显得 比较 公平 。 

DebitCredit 基准 深 受 系统 制造 三 商 们 的 欢迎 ， 因 为 它 提供 了 一 种 清楚 和 客观 的 性 能 度量 方法 。 不 
入， 大 多 数 系 统制 造 厂 商都 开始 使 用 这 个 基准 ， 并 纷纷 发 布 他 们 度量 的 优良 结果 。 不 幸 的 是 ， 没 有 一 
种 正式 的 机 制 来 证 明 或 反驳 这 些 系 统制 造 厂商 公布 的 结果 。 实 质 上 ， 制 造 厂商 可 以 随意 引用 那些 在 他 
们 看 来 比 竞争 对 手 更 有 优势 的 结果 。 显 然 ， 在 这 个 领域 ， 迫 切 需 要 有 一 些 独立 的 评估 和 控制 手段 。 为 
此 目的 ， 在 1988 年 ，Omri Serlin 成 功 地 说 服 了 8 家 计算 机 制造 厂商 联合 起 来 组 建 了 一 个 独立 的 事务 处 
理 委员 会 《Transaction Processing Council，TPC)。 现 在 ，TPC 大 约 由 40 家 公司 组 成 ， 其 中 包括 系统 
软件 和 硬件 制造 商 。 

摆 在 TPC 面前 的 第 一 个 任务 是 发 布 一 个 正式 的 具有 官方 权威 性 质 的 基准 套件 。 这 个 基准 于 1990 
年 发 布 ， 称 为 TPC-A。 为 了 与 技术 革新 和 基准 测试 科学 的 进步 保持 同步 ，TCP-A 现在 变 成 了 经 过 三 次 
重大 修订 后 的 第 5 个 版 本 ，TPC-C Version 5。 

TPC-C 基准 测试 套件 可 以 对 一 个 批发 产品 销售 公司 的 活动 进行 建 模 。 这 个 套件 是 一 种 受 控 的 5 种 
事务 类 型 的 混合 ， 这 5 种 事务 类 型 都 是 典型 的 订单 执行 系统 。 这 些 事务 包括 新 订单 开始 ， 库 存 等 级 查 
询 ， 订 单 状态 查询 ， 商 品 交付 记录 和 货款 支付 处 理 。 这些 事务 中 资源 最 密集 的 是 新 订单 开始 的 事务 ， 
它 至 少 构成 了 这 种 事务 组 合 的 45% 以 上 工作 量 。 

TPC-C 采用 远程 终端 仿真 软件 来 模仿 一 个 用 户 和 系统 之 间 的 交互 过 程 。 每 次 交互 活动 都 是 通过 一 
个 格式 化 的 数据 输入 屏 来 进行 的 ， 这 个 数据 屏 的 设计 非常 便于 数据 输入 员 的 使 用 。 仿 真 器 程序 从 菜单 
中 选择 一 项 事务 ， 就 像 是 一 个 真实 的 人 将 要 进行 的 操作 一 样 。 但 是 ， 这 种 选择 从 统计 的 角度 来 看 是 随 
机 的 ， 这 样 系统 就 可 以 执行 正确 的 事务 组 合 。 诸 如 客户 姓名 和 部 件 编号 这 样 的 输入 值 也 同样 是 随机 挑 
选 的， 这 样 可 以 避免 出 现 重复 的 高 速 缓存 命中 相同 的 数据 值 ， 而 引起 频繁 的 1/O 操作 。 

TPC-C 的 终端 到 终端 的 响应 时 间 是 从 “用 户 ” 完 成 所 要 求 的 输入 的 时 刻 起 到 系统 在 特定 的 终端 上 
显示 出 必要 的 反应 的 时 刻 止 的 这 段 时 间 。 在 最 新 的 TPC-C 规则 下 ， 除 了 库存 等 级 查询 外 ，90% 的 事务 
都 必须 准确 地 在 5 秒 钟 时 间 内 完成 。 库 存 查 询 被 排除 在 5 秒 规则 之 外 ， 是 因为 库存 等 级 可 能 会 在 一 个 
单 次 的 查询 事务 中 需要 检查 多 个 不 同 的 仓库 。 这 个 事务 处 理 和 其 他 事务 相 比 ， 需 要 更 多 的 I/O 操作 。 

要 记 住 的 是 ，TPC-C 套件 使 用 真实 的 系统 来 模仿 真实 的 商业 行为 。 因 此 ， 每 个 更 新 的 事务 都 必须 支 
持 一 个 产品 数据 库 的 ACID 特性 。 这些 特性 已 经 在 第 8 章 中 进行 了 描述 。TPC-C 的 ACID 特性 包括 加 锁 
和 解锁 ， 以 及 由 对 一 个 数据 库 日 志文 件 进行 日 志 更 新 所 提供 的 回 滚 〈 或 称 为 重新 运行 ，rollback) 能 力 。 

TPC-C 度量 标准 是 每 分 钟 内 完成 的 新 订单 事务 的 数目 (tmpC)， 虽然 其 他 各 种 事务 的 组 合并 发 地 
执行 在 同一 系统 上 。TPC-C 的 结果 报告 中 还 包含 一 个 性 价 比 ， 这 个 比值 是 用 系统 的 成 本 价格 除 以 吞吐 
量度 量 的 结果 。 因 此 ， 如 果 一 个 价格 为 90 000 美元 的 系统 提供 了 15 000 tpmC 的 吞吐 量 ， 那 么 系统 的 
性 价 比 为 6 美元 /tpmC。 系 统 的 价格 包括 执行 TPC-C 事务 所 必须 的 硬件 、 软 件 和 网 络 组 件 的 价格 。 测 
试 中 所 使 用 的 各 个 组 件 都 必须 可 以 在 结果 报告 的 时 间 对 公众 销售 。 这 个 规则 是 为 了 防止 厂商 使 用 一 些 
基准 专用 的 组 件 。 在 生成 基准 测试 结果 报告 中 所 涉及 到 的 所 有 系统 组 件 都 必须 非常 详细 地 在 一 份 完 全 
公开 的 报告 中 列 出 ， 并 提交 给 TPC。 公 开 的 配置 说 明 也 必须 包括 所 有 在 测试 过 程 中 有 影响 的 调整 参数 
(例如 ， 编 译 器 的 开关 )S 。 这 个 完全 公开 的 报告 还 要 包括 “机 器 所 有 者 的 总 费用 ”的 数字 ， 其 中 要 把 维 
护 和 支持 整个 系统 三 年 所 需 的 费用 考虑 进去 。 


名 ”对 于 系统 管理 员 来 说 ， 完 全 公开 报告 中 所 提供 的 调整 信息 ， 与 TPC-C 报告 中 所 涉及 的 各 种 信息 -- 样 ， 都 是 非常 
有 价值 的 资源 。 这 些 资源 可 以 用 来 帮助 寻找 优化 系统 性 能 的 方法 。 因 为 一 个 实际 的 工作 负载 不 等 间 于 一 个 
TPC-C 套件 中 设计 的 工作 负载 ， 所 以 报告 中 的 调整 信息 也 许 不 能 给 出 一 个 最 佳 的 结果 ， 但 它 通常 是 寻找 优化 方 
法 的 一 个 好 的 起 点 。 
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当 系 统 生 产 厂 商 把 TPC-C 结果 提交 给 TPC 时 ， 会 有 一 家 独立 的 审计 公司 对 报告 中 的 所 有 信息 进 
行 审计 ， 以 确保 报告 的 完整 性 和 准确 性 。 当 然 ， 审 计 人 员 不 可 能 重新 运行 这 种 测试 ， 因 此 这 些 符 吐 量 
的 数字 通常 都 是 一 些 表面 数值 ， 条 件 是 这 种 测试 被 正确 地 执行 。 一 旦 TPC 接受 了 报告 ， 就 会 把 报告 公 
布 在 它 的 网 站 上 供 客户 和 竞争 对 手 检查 。 有 时， 某 个 竞争 对 手 或 者 TPC 自己 会 质疑 某 个 制造 厂商 的 报 
告 。 遇 到 这 种 情况 时 ， 制 造 厂商 要 么 撤回 报告 ， 要 么 为 报告 辩护 。 有 时 一 个 报告 会 悄悄 地 撤 下 来 ， 原 
因 是 为 结果 进行 答辩 的 代价 实在 是 无 法 承受 ， 即 使 这 个 制造 厂商 的 要 求 很 有 根据 。 有 时 ， 系 统 供应 商 
也 可 能 自己 选择 撤回 报告 结果 ， 因 为 测试 中 的 配置 已 经 不 再 可 用 ， 或 者 是 系统 的 下 一 个 模型 已 经 比 这 
个 旧 的 模型 有 重大 的 改进 。 

TPC-C 仅仅 是 事务 处 理 委员 会 所 推出 的 多 个 基准 中 之 一 。 在 TPC 成 立时 ， 商 业 计算 领域 主要 由 各 
种 事务 处 理 系统 组 成 ， 这 些 系 统 同样 支持 财务 处 理 ， 例 如 敌 记 和 工资 单 。 这 些 系统 都 必须 有 一 组 清晰 
定义 的 输入 和 产生 一 个 清晰 定义 的 输出 ， 通 常 都 是 采用 打印 报告 和 表格 的 形式 输出 。 这 种 确定 性 的 模 
型 缺乏 在 当今 商业 环境 中 所 要 求 的 灵活 性 ， 即 难以 提供 深层 次 的 数据 分 析 工 具 。 许 多 公司 都 用 决策 支 
持 〈decision support) 工具 来 取代 静态 报告 。 这 些 应 用 程序 可 以 访问 大 量 的 输入 数据 来 提供 各 种 商业 
情报 信息 ， 为 市 场 导 向 和 商业 活动 服务 。 从 某 种 意义 上 来 说 ， 决 策 支 持 应 用 程序 与 事务 处 理应 用 程序 
是 完全 相反 的 类 型 。 因 此 ， 它 们 需要 使 用 不 同类 型 的 计算 机 系统 。 事 务 处 理 环境 处 理 的 是 大 量 的 持续 
时 间 较 短 的 过 程 ， 而 决策 支持 系统 处 理 的 是 一 些 数量 少 持续 时 间 较 长 的 过 程 。 

决策 支持 系统 不 会 对 在 线 查 询 给 出 即时 的 结果 。 但 是 ， 不 管 最 后 的 结果 如 何 有 用 ， 人 们 原意 等 待 
的 时 间 是 有 限 的 。 事 实 上 ， 如 果 决 策 支持 系统 的 速度 “ 太 慢 ?”， 企 业 管 理 人 员 都 不 会 很 情愿 地 使 用 它 ， 
因此 这 也 就 脱离 了 它 原来 的 目的 。 即 使 在 人 们 都 愿意 为 得 到 答案 而 等 待 “ 一 会 儿 ” 的 情况 下 ， 人 性 能 仍 
旧 是 一 个 大 问题 。 

为 了 应 对 这 个 相对 较 新 的 计算 领域 ，TPC 又 创建 了 两 个 基准 ，TPC-H 和 TPC-R， 用 来 描述 决策 
支持 系统 的 性 能 。 虽 然 这 两 个 基准 都 是 直接 针对 决策 支持 系统 的 ， 但 是 在 预先 知道 系统 的 报告 参数 时 ， 
TPC-R 基准 程序 可 以 度量 性 能 ， 即 可 以 利用 TPC-R 基准 程序 为 这 类 报告 建立 数据 库 索 引 和 对 数据 库 
进行 优化 。TPC-H 基准 程序 度量 一 个 系统 可 以 产生 特别 〈ad hoc) 查询 结果 的 能 力 ， 在 这 些 查询 中 查 
询 参数 都 不 是 预先 知道 的 。TPC-H 测试 结果 采用 每 小 时 的 查询 数目 来 表示 ， 即 QphH。 而 在 TPC-R 
中 的 测试 结果 则 表示 为 QphR。TPC 按照 查询 时 所 运行 的 数据 库 的 大 小 来 对 这 些 测试 结果 进行 分 类 ， 
内 为 在 一 个 100G 字 节 的 数据 中 执行 查询 和 在 一 个 1T 字 节 的 数据 中 执行 查询 是 两 个 完全 不 同 的 任务 。 

为 了 保持 与 时 代 同 步 ，TPC 同样 也 定义 了 度量 Web 服务 器 性 能 一 个 基准 ，TPC-W。 这 个 套件 的 
操作 与 TPC-C 基准 程序 在 思想 上 非常 相似 。 通 过 “远程 浏览 器 仿真 器 ”输入 一 些 随机 挑选 的 事务 ， 访 
问 一 组 提交 给 客户 的 选择 项 目 。 这 些 顾客 的 选择 是 零售 电子 商务 网 站 上 的 典型 选择 项 目 ; 浏览 物品 的 
分 类 目录 ， 查 看 购物 车 ， 以 及 使 用 一 个 安全 的 连接 来 购买 购物 车 中 的 物品 。TPC-W 度量 单位 是 每 秒 钟 
Web 上 的 交互 次 数 《Web interactions per second) ， 或 者 简称 为 WIPSS 。TPC-W 使 用 两 种 混合 的 选择 
操作 模式 。 这 两 种 模式 都 是 通过 分 析 从 实际 的 电子 商务 网 站 上 搜集 的 日 志 ， 利用 经 验 来 确定 的 。 其 中 
一 种 选择 操作 的 组 合 WIPSb， 主 要 是 针对 访问 大 多 数 情况 下 只 是 浏览 而 不 是 购买 商品 的 Web 站 点 的 。 
而 另外 一 种 WIPSo， 是 为 那些 客户 大 多 数 情况 下 是 购买 〈 或 订购 ) 商品 而 不 是 浏览 的 Web 站 点 服务 
的 。 同 TPC-C 一 样 ，TPC-W 的 事务 必须 保持 正确 的 数据 库 事务 的 ACID 特性 。 

与 TPC-C 一 样 ，TPC-H、TPC-R 和 TPC-W 的 结果 都 同样 要 受到 严格 的 审计 控制 。 内 此 ， 在 选择 
满足 企业 计算 服务 需求 的 系统 时 ， 这 些 度 量 方法 都 是 一 种 可 信赖 的 帮助 工具 。 在 使 用 TPC 基准 的 过 程 
中 过 到 的 主要 间 题 是 ， 人 们 总 是 假设 这 些 基 准 能 够 准确 地 预测 在 某 人 的 特定 的 工作 任务 下 的 系统 性 能 。 
但 这 并 不 是 TPC 的 主张 或 打算 。 研 究 表明 一 组 特定 的 实际 工作 负载 在 许多 方面 都 与 TPC 的 工作 负载 
不 同 (参见 下 面 的 补充 内 容 )。 对 于 计算 机 基准 来 说 ， 在 使 用 正确 时 是 一 个 不 可 缺少 的 工具 。 但 是 如 果 





名 ”这 里 的 WIPS 不 要 与 Whetstone Instructions per Second 相 混 淆 。 我 们 已 经 用 完了 唯一 的 4 个 单词 的 首 字 母 缩 
写 吗 ? 
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使 用 不 正确 ， 它 会 带 来 风险 。 
TPC 基准 : 一 个 真实 的 效 验 

事务 处 理 委员 会 已 经 做 了 各 种 努力 ， 试 图 用 其 TPC-C、TPC-H、TPC-R 基准 来 模拟 真实 世界 情 
况 。 要 确保 在 这 些 基 准 中 包含 一 个 普通 的 商业 事务 和 活动 的 真实 组 合 是 一 件 非常 困难 的 事情 。 随 机 选 
取 的 这 些 事务 活动 要 产生 尽 可 能 多 的 1/0 操作 。 特 别 是 数据 应 该 更 频繁 地 从 磁盘 中 提取 ， 而 不 是 从 高 
速 缓存 或 者 是 其 他 快速 存储 器 中 取出 。 

这 其 中 所 包含 的 思想 是 这 种 测试 不 应 该 偏向 于 某 种 特殊 类 型 的 计算 机 体系 结构 。 如 果 数 据 不 是 随 
机 产生 的 ， 那么 基准 将 会 有 利于 那些 有 大 量 高 速 缓存 存储 器 的 计算 机 系统 ， 但 是 在 真实 的 环境 中 却 可 
能 很 难 (成 比例 地 ) 实现 。 

很 多 年 来 ， 这 个 想法 一 直 没 有 引起 人 们 的 质疑 。 直 到 IBM 公司 一 名 攻读 博士 学 位 的 学 生 Windsor 
W. Hsu 从 事 了 一 系列 的 经 验 研究 后 ， 情 况 就 发 生 了 改变 。 在 IBM 公司 的 Almaden 研究 中 心 的 赞助 
下 ，Hsu 和 他 的 研究 伙伴 ， 在 IBM 公司 的 10 个 最 大 客户 的 系统 上 监视 了 几 百 万 个 处 理事 务 。Hsu 的 
工作 验证 TPC 基准 的 很 多 方面 的 内 容 ， 包 括 工作 负载 的 各 种 组 合 情 况 。 但 是 ，Hsu 发 现 真 实 世界 的 活 
动 在 两 个 重要 的 方面 与 TPC 模型 不 同 。 

第 一 ，TPC 基准 展示 的 是 一 个 持续 和 稳定 的 事务 比率 。 这 是 基准 专门 设计 的 ， 是 为 了 让 系统 可 以 
在 最 高 工作 负载 比率 的 情况 下 完全 应 对 各 种 事务 处 理 。 但 是 ，Hsu 发 现实 际 的 工作 负载 是 突 发 性 的 。 
一 组 事务 发 生 后 ， 到 下 一 组 活动 发 生 之 前 将 会 有 一 个 事务 暂停 的 时 段 。 对 于 系统 设计 者 来 说 ， 这 意味 
着 如 果 在 系统 软件 和 硬件 中 增加 有 效 的 动态 资源 分 配 设施 ， 将 会 改进 系统 的 整体 性 能 。 虽 然 许多 系统 
制造 广 商 事实 上 都 使 用 了 动态 资源 分 配 ， 但 是 他 们 的 这 些 努力 并 没有 得 到 TPC 基准 的 认可 。 

Hsu 的 第 二 个 主要 结果 对 TPC 基准 中 随机 选取 数据 和 工作 负载 的 观点 提出 了 严重 的 挑战 。 他 发 现 
真实 系统 表现 出 比 TPC 程序 要 大 得 多 的 “ 伪 顺 序 性 〈pseudo-sequentiality)>。 这 个 发 现 是 非常 重要 的 ， 
因为 许多 系统 都 会 从 磁盘 和 存储 器 中 预 取 数 据 。 如 果 使 用 预 取 数据 的 操作 ， 实 际 的 工作 负载 将 会 大 大 
受益 。 更 进一步 来 说 ， 数 据 访问 模式 的 伪 顺 序 性 使 得 数据 自己 会 很 好 地 适应 最 近 最 少 使 用 (LRU) 的 
高 速 缓存 和 存储 器 的 页 面 替换 策略 。 而 TPC 基准 却 不 会 这 样 做 。 

Hsu 的 工作 并 不 是 反对 TPC 基准 。 相 反 ， 它 对 人 们 可 以 从 基准 结果 中 推断 出 特定 的 真实 世界 的 情 
况 的 愚蠢 想法 进行 了 夸大 。 虽 然 TPC 基准 不 能 对 这 种 真实 世界 和 一 些 类 似 的 情形 建 模 ， 但 是 它 在 比较 
不 同系 统 的 体系 结构 的 性 能 时 仍然 可 以 继续 担当 一 种 诚实 、 公 平和 可 靠 的 准绳 。 | 


10. 4.5 系统 仿真 , 


TPC 基准 与 SPEC 基准 不 同 ，TPC 基准 致力 于 模仿 完整 的 计算 环境 。 虽然 TPC 基准 的 主要 目的 
是 度量 性 能 ， 但 是 他 们 模仿 的 环境 可 能 对 预测 在 不 同 的 条 件 下 的 系统 性 能 ， 进 而 优化 系统 的 性 能 也 同 
样 有 用 。 一 般 来 说 ,仿真 方法 为 我 们 提供 了 一 些 工具 ， 利 用 这 些 工 具 可 以 对 系统 行为 的 各 个 方面 进行 
建 模 和 预测 ， 而 无 需 使 用 仿真 器 要 模拟 的 完全 真实 的 环境 。 

仿真 对 于 估计 尚未 存在 的 系统 或 系统 配置 的 性 能 非常 有 用 。 聪 明 的 系统 设计 师 常常 会 在 构建 商业 
版 本 的 产品 之 前 ， 对 新 硬件 或 软件 系统 进行 仿真 研究 。1967 年 ， 斯 坦 福 (Stanford) 大 学 的 博士 研究 
生 Norman R. Nielson 在 一 篇 名 为 “The Analysis of General Purpose Computer Time-Sharing Systems?” 
的 论文 中 充分 展示 了 这 种 仿真 方法 的 智慧 之 处 。Nielson 的 论文 总 结 了 他 在 当时 还 没有 发 布 的 IBM 
360/67 分 时 共享 计算 机 系统 〈TSS) 上 的 仿真 研究 及 结果 。 利 用 IBM 公司 发 表 的 规格 说 明 书 ，Nielson 
的 研究 工作 揭示 了 360/67 分 时 系统 存在 的 一 些 严重 缺陷 。Nielson 的 发 现 促使 IBM 在 广泛 发 布 这 个 系 
统 之 前 ， 改 进 了 原来 的 系统 设计 。 
”仿真 是 完整 系统 的 各 个 特定 方面 的 模型 。 这 些 模型 可 以 让 系统 设计 师 在 一 个 与 真实 系统 分 离 的 可 
控 环境 中 随意 实现 各 种 “如 果 就 怎样 ”的 假设 性 测试 。 例 如 ， 假 设 我 们 现在 对 一 个 系统 可 以 支持 的 最 
大 化 的 并 发 任务 数目 感 兴趣 。 调 整 的 参数 包括 每 个 任务 的 存储 器 空间 分 配 和 它们 占用 CPU 的 时 间 片 断 
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的 长 度 。 基 于 我 们 所 了 解 的 每 个 任务 特性 ， 在 仿真 过 程 中 可 以 调整 各 种 参数 值 直到 找到 一 个 最 佳 的 平 
衡 分 布 为 止 。 在 有 真实 任务 和 真实 用 户 的 实际 环境 中 进行 这 样 的 修补 工作 将 会 引发 一 些 真正 的 风险 ， 
最 糟糕 的 情况 是 可 能 没有 人 能 够 完成 任何 工作 。 

系统 仿真 遇 到 的 最 大 挑战 之 一 是 如 何 确定 系统 工作 量 的 特性 。 系 统 工作 负荷 量 的 各 种 组 合 形式 应 
该 与 被 模拟 的 系统 组 件 相 对 应 。 确 定 工作 量 的 一 种 方法 是 从 检查 系统 的 日 志 开始 推演 出 一 个 综合 的 
(统计 的 ) 系统 工作 量 的 分 布 图 。 这 是 TPC 在 为 它 的 TPC-W 基准 生成 测试 工作 量 组 合 时 所 采用 的 一 种 
办 法 。 

如 果 仿真 器 只 把 注意 力 放 在 系统 的 某 个 组 件 上 ， 那 么 这 样 捕获 到 的 整个 系统 或 整个 工作 量 的 行为 
将 不 会 产生 足够 的 数据 粒度 〈 或 间隔 大 小 ，granularity) 。 例 如 ， 假 设 系统 设计 师 正在 设法 确定 一 个 理 
想 的 组 关联 的 存储 器 Cache 配置 结构 。 这 个 配置 包括 一 级 和 二 级 高 速 缓存 的 大 小 ， 以 及 为 每 个 高 速 组 
存 氧 所 设置 的 组 的 大 小 。 对 于 这 种 类 型 的 仿真 ， 仿 真 器 需要 详细 的 存储 器 访问 数据 。 这 种 信息 通常 是 
通过 对 系统 日 志 进 行 跟踪 得 出 的 。 

系统 跟踪 (system traces) 可 以 通过 使 用 硬件 或 软件 深入 探测 感 兴趣 的 组 件 的 各 种 活动 来 搜集 详 
细 的 系统 行为 信息 。 探 测 工作 会 跟踪 每 个 系统 组 件 的 实际 行为 的 细节 ， 可 能 包括 二 进 制 指令 和 存储 器 
的 引用 。 探 测 所 搜集 到 的 跟踪 信息 仅仅 由 几 秒 钟 的 系统 活动 组 成 ， 因 为 系统 数据 集 的 输出 实在 是 太 大 
了 。 为 了 产生 一 个 在 统计 上 有 意义 上 的 模型 ， 一 般 需 要 进行 多 个 跟踪 探测 。 

在 设计 仿真 器 时 ， 必 须 对 仿真 器 的 目的 做 一 个 清晰 的 定义 。 这 里 ， 人 们 需要 有 好 的 工程 判断 力 来 
从 一 大 堆 不 重要 的 系统 特性 中 区 分 出 重要 的 特性 。 如 果 模 型 过 于 详细 ， 则 模型 运行 的 代价 会 很 高 ， 而 
且 编 写 模型 会 非常 耗 时 。 相 反 ， 如 果 模 型 太 简单 而 忽略 一 些 关键 因素 ， 那 么 仿真 器 会 产生 错误 的 结果 
令 人 误导 。 系 统 仿真 是 一 种 出 色 的 工具 ， 但 是 就 像 其 他 任何 工具 一 样 ， 我 们 必须 保证 它 适合 于 特定 的 
任务 。 我 们 还 要 对 系统 仿真 器 进行 有 效 性 验证 ， 以 确保 构建 模型 所 做 的 各 种 假设 的 正确 性 。 当 然 ， 最 
简单 的 模型 是 最 容易 验证 的 。 


10.5 CPU 性 能 优化 


长 期 以 来 ，CPU 的 性 能 一 直 是 系统 优化 工作 的 重点 。 现 在 ， 没 有 一 种 单一 的 方法 来 增强 CPU 的 
性 能 ， 因 为 CPU 的 处 理 能 力 受 到 许多 因素 的 影响 。 例 如 ， 程 序 代 码 会 影响 指令 计数 ， 编 译 器 会 影响 指 
令 计数 和 每 条 指令 的 平均 时 钟 周 期 数 ， 指 令 系统 决定 了 指令 计数 和 每 条 指令 的 平均 时 钟 周期 数 ， 实 际 
的 硬件 组 织 结构 设 定 了 每 条 指令 的 时 钟 周 期 数 和 时 钟 周期 时 间 。 

一 些 潜在 的 CPU 优化 技术 包括 集成 的 浮 点 单元 、 并 行 执行 单元 、 专 用 指令 、 指 令 流水 线 、 分 支 预 
测 和 代码 优化 。 因 为 除了 最 后 两 项 外 ， 其 他 内 容 都 已 经 在 前 面 章节 中 做 了 介绍 ， 所 以 这 里 我 们 集中 讨 
论 分 支 预测 和 用 户 代 码 优化 。 


10. 5. 1 分 支 优化 


至 此 ,读者 应 该 已 经 非常 熟悉 CPU 的 取 指 - 译 码 -执行 周期 。 指 令 流 水 线 对 CPU 的 性 能 有 非常 重 
要 的 影响 ， 因 此 大 多 数 的 现代 体系 结构 中 都 如 入 了 指令 流水 线 作 业 。 然 而 ， 分 支 转移 会 给 流水 线 作 业 
带 来 不 利 影响 。 考 虑 一 个 条 件 分 支 的 情况 ， 在 这 种 情况 下 只 有 等 到 当前 指令 执行 完成 后 才 知 道 下 一 条 
指令 的 地 址 。 这 样 会 迫使 通过 流水 线 的 指令 流产 生 延 迟 ， 因 为 直到 处 理 器 完成 执行 这 条 分 支 指令 前 ， 
处 理 器 不 知道 接 下 来 要 执行 哪 一 条 指令 。 事 实 上 ， 流 水 线 越 长 〈 指 流水 线 有 更 多 的 级 )， 那 么 在 知道 接 
下 来 是 哪 一 条 指令 进入 流水 线 之 前 ， 流 水 线 必 须 等 待 的 时 间 越 长 。 

现代 处 理 器 中 使 用 的 流水 线 越 来 越 长 。 通 常 ， 大 约 有 20% 到 30% 的 机 器 指令 涉及 到 分 支 转移 ， 而 
且 研 究 指出 大 概 有 65% 的 分 支 转 移 被 CPU 采用 了 。 此 外 ， 在 两 次 分 支 转移 之 间 ， 各 种 程序 平均 只 有 5 
条 指令 ， 这 样 会 造成 许多 流水 线 停止 。 因 此 ， 人 们 迫切 地 需要 降低 这 种 由 于 分 支 转移 给 流水 线 带 来 的 
不 利 影 响 。 造 成 流水 线 停止 的 各 种 因素 被 称 为 冒险 (hazard)。 这 些 冒 险 肉 素 包 括 数 据 相 关 性 、 资 源 冲 
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突 和 来 自 存储 器 的 提取 访问 延迟 。 除 了 在 检测 到 一 个 冒险 时 停止 流水 线 外 ， 我 们 对 于 流水 线 几乎 没有 
其 他 控制 。 然 而 ， 分 支 优化 处 理 是 在 我 们 所 能 够 控制 的 范围 之 内 。 基 于 这 个 理由 ， 分支 预测 已 经 成 为 
人 们 在 提高 CPU 性 能 方面 努力 发 展 的 一 个 重点 方向 。 

延迟 转移 (delayed branching) 是 处 理 分 支 转移 对 流水 线 的 影响 的 一 种 办 法 。 例 如 ， 当 执行 一 个 条 
件 转移 指令 时 ，CPU 先 执 行 一 条 或 多 条 该 分 支 指令 后 面 的 指令 ， 而 不 管 这 条 分 支 执行 的 结果 如 何 。 我 
们 可 以 使 用 这 种 思想 ， 否 则 分 支 后 面 的 几 个 时 钟 周期 会 被 浪费 。 要 实现 这 种 想法 ， 可 以 在 分 支 指令 后 
插入 一 条 指令 ， 并 在 实际 转移 前 执行 这 条 指令 。 这 样 做 的 实际 效果 是 紧 跟 在 分 支 指 令 后 的 指令 会 在 分 
支 指令 生效 产生 结果 之 前 被 执行 。 

下 面 的 例子 给 出 了 这 个 概念 的 最 好 解释 。 考 虑 下 面 一 个 程序 : 


Add RE, RZ RR 
Branch Loop 
Div R4, R5, R6 


Loop: Mult 
下 面 是 跟踪 流水 线 的 执行 结果 : 
时 间 片 断 : 1 2 3 4 5 6 








Add F D 下 
Branch F D E 





DS de 





ha mh he ED MN 
Mult F D 


除法 指令 代表 了 一 个 被 浪费 的 指令 时 间 片 断 ， 因 为 这 个 指令 只 有 取 指 ， 但 是 由 于 有 分 支 转移 ， 这 
条 除法 指令 永远 不 会 被 解码 和 执行 。 这 个 时 间 片 断 可 以 被 另外 的 指令 来 填充 。 填 充 过 程 是 通过 颠倒 分 
支 指令 和 其 他 将 要 执行 的 指令 的 执行 顺序 来 实现 的 。 


时 间 片 断 ; I 2 3 4 5 6 


Branch D 










dd 2 
Mult 

读者 应 该 非常 清楚 地 知道 ， 尽 管 延 迟 分 支 使 用 的 是 可 能 会 被 浪费 的 分 支 延 迟 的 时 间 片 断 ， 但 是 延 
述 分 支 实际 上 对 指令 执行 的 顺序 进行 了 重新 排序 。 因 此 ， 编 译 器 必须 执行 一 个 数据 相关 性 分 析 来 确定 
延迟 转移 是 否 可 能 。 在 分 支 转 移 后 可 能 会 出 现 没 有 指令 可 移动 的 情形 (进入 了 延迟 时 间 片 断 )。 在 这 种 
情况 下 ， 要 在 分 支 转移 后 放置 一 个 NOP (no operation) 指令 ， 即 不 执行 任何 操作 的 指令 。 很 显然 ， 在 
这 种 情况 下 ， 分 支 指令 的 影响 就 与 没有 使 用 延迟 转移 是 一 样 的 。 

编译 器 可 以 有 很 多 方式 在 延迟 时 间 段 选择 指令 。 第 一 种 选择 是 不 管 是 否 有 分 支 的 出 现 执行 一 条 有 
用 的 指令 。 分 支 代码 段 前 的 指令 是 最 佳 选择 。 另 外 可 能 包括 的 指令 是 如 果 发 生 转 移 执行 的 指令 ， 以 及 
不 发 生 转 移 也 不 会 出 现 危 害 的 指令 。 相 反 的 情况 也 同样 考虑 :如果 不 发 生 转 移 时 的 执行 程序 段 ， 但 是 
在 转移 发 生 时 也 不 会 产生 和 危害。 人选 指令 也 包括 不 管 是 否 发 生 转 移 都 不 会 产生 危害 的 指令 。 推 迟 转移 
有 减低 硬件 代价 的 好 处 ， 并 非常 依赖 于 编译 器 在 延迟 时 间 段 的 填充 指令 。 

另 一 种 减 小 由 于 分 支 转移 而 引起 的 不 利 影响 的 方法 是 采用 分 支 预测 〈branch prediction) 。 分 支 预 
- 测 是 指 试图 在 指令 流 中 猜测 下 一 条 指令 的 处 理 过 程 ， 这 样 可 以 避免 由 于 分 支 指令 造成 流水 线 作 业 的 阻 
塞 。 如 果 预 测 成 功 ， 在 流水 线 中 就 不 会 引入 延迟 。 如 果 预 测 不 成 功 ， 则 必须 对 流水 线 进 行 刷新 ， 必 须 
抛弃 所 有 由 于 这 种 错误 计算 所 产生 的 计算 结果 。 分 支 预 测 技术 根据 分 支 转移 的 特点 分 为 : 循环 控制 分 
支 转移 、if/then/else 分支 转移 或 子 程序 分 支 转移 。 

为 了 充分 采用 分 支 预 测 的 好 处 ， 流 水 线 必须 保持 满 。 因 此 ， 一 旦 做 出 一 个 预测 ， 就 要 提取 指令 并 
开始 执行 。 这 个 过 程 称 为 推测 执行 (speculative execution) 。 这 些 指令 会 在 确认 它们 是 否 需 要 执行 之 前 
就 执行 。 如 果 发 现 一 个 预测 不 正确 ， 必 须 取 消 推测 执行 的 工作 。 
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分 支 预测 就 像 一 个 黑 盒子 ， 我 们 输入 不 同 数据 ， 得 到 一 个 预测 的 目标 指令 作为 输出 。 如 果 只 
是 简单 地 将 要 讨论 的 代码 输 进 黑 盒子 ， 这 种 方法 就 是 大 家 所 知 的 静态 预测 (static prediction) 。 如 
果 除 了 这 种 代码 之 外 ， 我 们 还 将 历史 状态 (有 关 这 个 分 支 指令 的 先前 信息 和 它 过 去 的 结果 ) 也 同 
样 输入 ， 那 么 这 个 黑 盒子 就 在 使 用 动态 预测 (dynamic prediction) 。 国 定 预 测 (fixed prediction) 是 
总 是 相同 的 预测 ;要么 执行 这 个 分 支 ， 要 人 么 不 执行 ， 并 且 每 次 磁 到 这 个 分 支 指令 时 ， 预 测 都 是 相 
同 的 。 真 预测 (true prediction) 只 有 两 种 可 能 的 结果 ， 要 么 “采用 分 支 〈take branch)”， 要 么 
“不 采用 分 支 ”。 

在 固定 预测 中 ， 如 果 假 设 不 采用 分 支 结 果 ， 那 么 这 里 所 包含 的 意义 就 是 已 经 假定 了 分 支 转移 不 会 
发 生 ， 而 要 继续 正常 的 指令 顺序 流程 。 但 是 ， 分 支 处 理 还 会 并 行 地 完成 ， 以 防止 万 一 发 生 分 支 转移 的 
情况 。 如 果 预 测 是 正确 的 ， 那么 这 些 预 处 理 信息 会 被 删除 ， 而 执行 过 程 会 继续 下 去 。 如 果 预 测 是 不 正 
确 的 ， 那么 这 种 推测 处 理会 被 删除 ， 并 使 用 预 处 理 信息 继 续 沿 着 正确 的 指令 路 径 执行 。 

在 固定 预测 中 ， 如 果 假 设 总 是 采用 分 支 ， 那么 同样 要 为 一 次 不 正确 的 预测 做 好 准备 。 在 推测 处 理 
开始 前 ， 要 保存 各 种 状态 信息 。 如 是 猜测 是 正确 的 ， 则 这 个 保存 的 信息 会 被 删除 。 如 果 预 测 是 不 正确 
的 ， 这 个 推测 处 理会 被 删除 ， 而 这 个 保存 的 信息 要 用 来 恢复 原来 采用 正确 路 径 时 的 执行 环境 。 

由 于 使 用 了 先前 各 种 分 支 转移 情况 的 历史 记录 ， 所 以 动态 预测 可 以 增强 分 支 预测 的 准确 性 。 这 种 
信息 随后 会 和 代码 一 起 进行 组 合 ， 并 输入 分 支 预测 器 ( 即 黑 盒 子 )。 用 来 进行 分 支 预测 的 主要 部 件 是 分 
支 预测 缕 冲 器 《branch prediction buffer) 。 这 个 高 速 缓冲 器 是 由 分 支 指令 的 低地 址 部 分 来 索引 的 ， 地 址 
的 其 他 位 用 来 指示 这 个 分 支 转移 最 近 是 否 被 采用 。 分 支 预测 缓冲 器 总 是 使 用 一 个 小 的 位 数 来 返回 预测 
结果 。 一 位 动态 预测 (one-bit dynamic prediction) 使 用 一 个 单一 位 来 记录 上 次 出 现 的 分 支 转移 是 否 被 
采用 。 二 位 预测 (two-bit prediction〉 为 一 个 给 定 的 分 支 指 令 保 留 两 个 先前 的 分 支 转移 的 历史 。 一 个 额 
外 的 位 则 用 来 帮助 在 循环 的 最 后 减少 错误 预测 〈 即 这 个 循环 退出 时 ， 而 不 是 像 先 前 一 样 的 分 支 转移 ) 。 
这 两 个 分 支 预测 位 可 以 用 不 同 的 方式 表示 状态 信息 。 例 如 ，4 种 可 能 的 位 组 合 模式 可 以 指示 采用 这 个 
分 支 转移 的 历史 概率 (11， 大 量 采 用 ; 10: 很 少 采 用 ; 01; 很 少 不 采 用 ; 00: 大 量 不 采用 )。 只 有 当 一 
个 错误 预测 发 生 两 次 时 ， 这 个 概率 才 会 发 生 改 变 。 

早期 分 支 预 测 的 实现 几乎 无 一 例外 地 都 是 使 用 静态 预测 类 型 。 大 多 数 比较 新 的 处 理 器 (包括 
Pentium、PowerPC、UltraSparc 和 Motorola 68060) 都 使 用 二 位 动态 分 支 预测 ， 这 样 预测 具有 较 高 的 
准确 性 和 较 低 的 错误 预测 率 。 一 些 超 标量 体系 结构 的 处 理 器 要 求 使 用 二 位 动态 预测 ， 而 一 些 其 他 处 理 
器 只 是 将 它 作为 一 种 选择 方案 。 许 多 系统 都 采用 专用 电路 来 处 理 分 支 预测 问题 ， 这 样 可 以 产生 更 及 时 
和 准确 的 预测 。 ， 


10. 5.2 使 用 好 的 算法 和 简单 的 代码 


最 好 的 处 理 器 硬件 和 最 佳 的 编译 器 也 只 能 在 一 定 程度 上 加 快 程序 运行 。 它 们 永远 无 法 与 一 个 精通 
高 效 算法 科学 和 代码 设计 的 人 相 比 。 读 者 可 以 回忆 第 6 章 中 介绍 的 有 关 比 较 行 优先 和 列 优先 访问 数组 
的 例子 。 其 中 的 基本 思想 是 如 果 将 数据 的 访问 方式 和 数据 的 存储 方式 匹配 得 更 加 紧密 的 话 ， 就 可 以 达 
到 增强 系统 性 能 的 目的 。 例 如 ， 如 果 一 个 数组 是 采用 行 优先 存储 的 ， 而 我 们 要 使 用 一 种 列 优先 顺序 进 
行 数据 访问 ， 那 么 数据 的 局 部 性 原理 将 会 减弱 ， 潜 在 地 导致 系统 的 性 能 下 降 。 尽 管 编译 器 可 以 在 一 定 
程度 上 改善 系统 的 性 能 ， 但 是 从 根本 上 来 说 ， 这 种 改善 的 范围 是 由 低层 次 的 代码 优化 所 限制 的 。 程 序 
代码 对 系统 性 能 的 各 个 方面 都 有 非常 大 的 影响 ， 包 括 从 流水 线 作业 到 存储 器 访问 直到 I/O 操作 。 本 节 
将 介绍 一 些 代码 优化 机 制 。 作 为 一 个 程序 员 ， 可 以 应 用 这 些 方法 使 得 计算 机 系统 达到 最 佳 的 操作 性 能 。 

操作 计数 《operation counting) 是 提高 程序 性 能 的 一 种 方法 。 利 用 这 种 方法 ， 先 估算 出 在 一 个 循 
环 中 所 执行 的 指令 类 型 的 数目 ， 然 后 确定 每 种 指令 类 型 所 需 的 机 器 周期 数 。 随 后 ， 这 些 信息 会 用 来 实 
现 更 好 的 程序 指令 平衡 。 这 种 思路 是 在 某 个 给 定 的 体系 结构 下 力图 使 用 最 好 的 指令 组 合 来 编写 程序 的 
循环 〈 例 如 ， 装 载 、 存 储 、 整 数 操作 、 浮 点 操作 和 系统 调用 等 )。 要 记 住 的 是 ， 适 用 于 某 个 硬件 平台 的 





性 能 度量 和 分 条 329 











好 的 指令 组 合 ， 对 于 另外 一 个 不 同 的 硬件 平台 未 必 是 一 个 好 的 指令 组 合 。 

内 为 在 程序 中 广泛 地 使 用 循环 过 程 ， 央 此 循环 也 是 系统 优化 的 最 佳 选 择 对 象 。 特 别 是 向 套 循 
环 会 表现 出 许多 令 人 感 兴趣 的 优化 机 会 。 在 经 过 一 番 研 究 后 ， 我 们 可 以 改进 存储 器 访问 模式 和 增 
加 指令 级 的 并 行 执行 。 循 环 展开 〈loop unrolling) 是 程序 员 可 以 方便 使 用 的 一 种 方法 。 循 环 展开 
就 是 展开 一 个 循环 的 过 程 ， 这 样 每 个 新 迭代 中 都 包含 几 个 原来 的 迄 代 操作 ， 因 而 每 个 循环 迭代 操 
作 都 可 以 完成 更 多 的 计算 工作 。 利 用 这 种 方法 ， 每 次 都 可 以 通过 展开 的 循环 处 理 多 个 循环 迭代 操 
作 。 例 如 : 


for (Im 1; = 30; i++) 
afil = a[i] + b[i] * ci 


展开 (二 次 ) 后 变 成 : 
for (i = 1; i C= 30; it™3) 
{ a[li] » a[li] + b[i] * ec; 
a{fi+1] 一 a[i+l] + bl[i+1] * c; 
a[i+2] = a[i+2] + bfi+2] * c; ) 

粗 看 起 来 ， 这 似乎 是 一 种 很 差 的 代码 编写 方式 。 但 是 ， 这 种 代码 方式 减少 了 循环 的 管理 费用 (如 
于 标 变 量 的 维护 ) ， 而 且 有 助 于 在 流水 线 作 业 中 控制 各 种 冒险 。 这 种 代码 结构 通常 允许 不 同 循环 先 代 操 
作 并 行 执行 。 另 外 ， 由 于 数据 相关 性 变 小 ， 所 以 可 以 进行 更 好 的 指令 调度 和 更 好 地 使 用 寄存 器 。 很 显 
然 ， 代 码 的 数量 增加 了 ， 所 以 这 并 不 是 在 程序 的 每 个 循环 中 都 应 该 采用 的 技术 。 这 种 方法 最 好 是 使 用 
在 占用 非常 多 的 执行 时 间 的 代码 片段 中 。 如 果 把 循环 展开 应 用 在 能 够 获得 最 大 性 能 改进 的 程序 部 分 ， 
那么 这 种 代码 优化 努力 也 就 得 到 了 最 好 的 回报 。 这 种 循环 展开 技术 也 同样 适用 于 while 循环 ， 虽 然 这 
种 应 用 并 不 是 十 分 直截了当 。 

另 一 种 非常 有 用 的 循环 优化 技术 是 循环 并 合 。 循 环 并 合 (loop fusion) 是 使 用 相同 的 数据 项 将 多 个 
循环 组 合 起 来 。 这 样 可 以 增强 高 速 缓存 的 性 能 ， 增 加 指令 级 的 并 行 执行 ， 并 减少 循环 开销 。 下 面 是 一 
个 循环 并 合 的 例子 : 

for (i=0; iCN; .i++) 

Ci = A[i} + Bl[i}; 
for (im0; i<N; i++) 
DIi] = E[i} + Cl[il; 
并 合 结果 为 : 


for (i=0; ICN; I++) { 
Cfil = A[i] + B[i] 
D{i] = E[i} + Cl[i];) 


有 时 ， 潜 在 的 循环 合并 可 能 性 不 像 在 上 述 代码 中 显而易见 。 例 如 下 面 的 程序 段 ， 


for (i=1; i《100; itt+) 
A[i] = B[i] + 8; 
for (i=l; iC99; i++) 
Ci = A[i+1] * 4; 
如 何 并 合 这 些 循环 看 起 来 并 不 是 非常 清楚 ， 因 为 第 二 个 循环 使 用 了 一 个 数组 A 中 的 参数 值 ， 而 数 
组 A 是 这 个 循环 计数 值 前 面 的 一 个 数组 。 但 是 ， 我 们 可 以 非常 方便 地 将 代码 改写 为 : 
A[i] = B{1] + 8; 
for (i~2; i<100; iH+) { 
A[i] = B[i] + 8;} 
for (i™l; i¢99; i++) ( 
Ci] = Afi+l] * 4; } 


现在 就 可 以 对 这 些 循环 进行 并 合 ，， 
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i=-1: 
Afil = B[i] + 8; 
for (j=0: j<98; j+r) { 
i=j+.2; 
A[i] 一 Bfi + 8; 
i=-j+1:; 
C[i] = Afi+l] * 4; } 
循环 拆 分 (loop fissiop) 是 把 一 些 大 循环 拆 分 成 一 些小 循环 ， 这 种 方法 同样 也 可 以 用 来 进行 循环 
优化 ， 因 为 它 可 以 消除 某 些 数据 相关 性 和 减少 由 于 数据 冲突 引起 的 高 速 缓存 延迟 。 循 环 拆 分 的 一 个 例 
子 是 循环 剥离 〈loop peeling)， 这 个 过 程 是 从 循环 中 移 去 开始 语句 或 结束 语句 。 通 常 ， 这 是 一 些 包含 循 
环 边界 条 件 的 语句 。 例 如 ， 下 面 的 代码 : 


for (i=1; icNf+f1; i+t+) { 


if (i~=w=1) 
Afil = 0; 
else if (i=*N) 
Ai = N: 


else 
Atil = A[i] + 8;]} 

可 以 变 成 : 

A[1] = 90; 

for (im=2; i<N; i++){ 

A[i]} = A[i] + 8; } 

AIN] = N; 

这 个 循环 剥离 的 例子 可 以 产生 更 多 的 指令 级 并 行 执行 ， 因 为 它 从 循环 中 移 走 了 分 支 转移 指令 。 

实际 上 ， 我 们 已 经 间接 提 到 了 循环 交换 (loop interchange) 的 概念 ， 循 环 交 换 是 一 种 对 循环 进行 
重新 安排 的 处 理 过 程 ， 这 样 可 以 使 得 访问 存储 器 的 方式 与 数据 存储 的 方式 更 加 接近 。 在 大 多 数 编程 请 
言 中 ， 都 是 采用 行 优先 〈row-major) 的 次 序 来 存储 循环 过 程 。 使 用 行 优先 而 不 是 列 优先 的 次 序 访问 数 
据 ， 可 以 减少 高 速 缓存 的 缺失 率 ， 并 产生 更 好 的 引用 局 部 性 。 

循环 优化 是 改进 程序 性 能 的 一 个 重要 工具 。 它 很 好 地 示范 了 如 何 使 用 计算 机 组 成 原理 和 体系 结构 
的 知识 来 编写 优秀 的 程序 代码 。 当 进行 程序 代码 优化 时 ， 请 参考 本 书 下 面 的 补充 内 容 中 所 列 出 的 一 些 
程序 优化 技巧 。 大 家 可 以 思考 一 些 方法 ， 在 这 些 方法 中 每 种 程序 优化 技巧 都 会 考虑 各 种 不 同 的 系统 组 
件 。 并且， 应 该 能 够 解释 每 种 方法 的 基本 原理 。 

尝试 的 事情 越 多 ， 成 功 的 机 会 就 越 大 。 应 该 记 住 的 是 ， 看 起 来 应 该 可 以 提高 系统 性 能 的 调整 措施 
通常 不 是 马上 就 可 以 取得 成 功 。 在 很 多 时 候 ， 为 了 使 优化 的 效果 更 加 明显 ， 必 须 将 这 些 优化 的 概念 组 
合 起 来 使 用 。 本 
程序 优化 技巧 

* 为 编译 器 提供 尽 可 能 多 的 目的 信息 。 尽 可 能 使 用 常数 和 局 部 变量 。 在 程序 诸 言 规则 人 允许 的 情况 

下 ， 定 义 一 些 原 型 和 声明 一 些 静态 函数 。 尽 可 能 使 用 数组 来 代替 指针 。 

*。 避免 不必 要 的 类 型 构造 和 尽量 减少 浮 点 数 到 整数 的 转换 。 

。 避 免 程 序 出 现 上 溢 和 下 滋 。 

。 使 用 合适 的 数据 类 型 〈 例 如 ， 浮 点 、 双 精度 、 整 型 ) 。 

“考虑 使 用 乘法 来 代替 除法 。 

。 除 去 不 必要 的 分 支 指令 。 

* 在 可 能 的 情况 下 ， 使 用 迭代 方法 来 代替 递归 方法 。 

* 在 最 可 能 的 情况 下 ， 首 先 建立 条 件 语句 〈 例 如 ，if、switch、case)。 

， 在 结构 中 声明 变量 时 ， 要 遵循 最 大 的 元 素 首先 声明 的 次 序 。 

。 当 程序 有 性 能 问题 时 ， 在 开始 程序 优化 之 前 先 对 程序 进行 剖析 〈profiling) 处 理 。 成 型 是 把 程序 








性 能 度量 和 分 析 331 








代码 拆 分 成 小 块 的 处 理 过 程 ， 而 且 要 对 这 些 代码 小 块 进行 定 时 标记 以 确定 哪 一 个 代码 块 占用 的 


时 间 最 多 。 

“水 远 不 要 抛弃 使 用 一 种 只 是 基于 系统 原始 性 能 的 算法 。 只 有 当 完 全 优化 所 有 的 算法 后 才 会 有 一 个 

公平 的 算法 比较 出 现 。 本 
10.6 磁盘 性 能 


尽管 CPU 和 存储 器 的 性 能 是 系统 性 能 中 最 重要 的 因素 ， 但 是 理想 的 磁盘 性 能 对 系统 的 处 理 能 力 
《吞吐 量 ) 也 是 至 关 重 要 的 。 大 多 数 用 户 与 系统 交互 过 程 都 涉及 到 某 种 类 型 的 磁盘 输入 或 输出 。 另 外 ， 
当 出 现 页 面 错误 〈 缺 页 ) 时 ， 也 可 能 发 生 磁 盘 LO。 这 种 MO 操作 的 发 生 时 间 和 持续 长 短 都 不 是 用 户 
或 程序 员 能 够 控制 的 。 如 果 具 有 一 个 功能 正常 的 I/O 子 系统 ， 整 个 系统 的 吞吐 量 会 比 MO 子 系统 功能 
不 佳 时 高 出 一 个 数量 级 。 由 于 系统 性 能 的 要 求 很 高 ， 所 以 从 一 开始 就 必须 对 磁盘 系统 进行 精心 地 设计 
和 配置 。 在 系统 的 使 用 寿命 期 内 ， 必 须 经 常 检查 磁盘 子 系统 并 进行 性 能 调整 。 本 节 介 绍 有 关 1/O 系统 
性 能 的 主要 内 容 。 这 里 引入 的 一 些 基 本 概念 ， 无 论 是 对 于 挑选 一 个 新 的 磁盘 系统 ， 还 是 尽力 使 现 有 的 
磁盘 系统 运行 达到 最 佳 状态 ， 都 是 非常 有 用 的 。 


10.6.1 性 能 问题 


磁盘 驱动 器 的 性 能 问题 在 整个 系统 性 能 中 很 重要 ， 因 为 相对 于 CPU 或 内 存 的 速度 来 说 ， 从 磁盘 中 
取 回 一 条 信息 所 需 的 时 间 是 相当 长 的 。CPU 在 当 所 有 的 操作 数 都 在 寄存 器 中 时 ， 执 行 一 条 指令 仅仅 只 
需 几 纳 秒 的 时 间 。 如 果 在 CPU 完成 一 个 任务 之 前 需要 从 内 存 中 取出 一 个 操作 数 ， 那 么 这 个 执行 时 间 将 
会 上 升 到 几 十 纳 秒 。 但 是 ， 如 果 这 个 操作 数 必须 从 磁盘 中 取出 时 ， 完 成 任务 所 需 的 时 间 将 猛 增 到 几 十 
毫秒 ， 增 加 了 100 万 倍 ! 更 有 甚 者 ， 因 为 CPU 分 派 1/O 请 求 的 速度 要 比 磁盘 驱动 器 跟随 响应 的 速度 快 
得 多 ， 所 以 磁盘 驱动 器 就 变 成 了 系统 吞吐 量 的 瓶颈 。 事 实 上 ， 当 系统 表现 出 “比较 低 ” 的 CPU 利用 率 
时 ， 很 可 能 就 是 因为 CPU 是 在 频繁 地 等 待 1/O 请 求 操作 的 完成 。 这 样 的 -- 个 系统 就 是 属于 1/O 约束 
的 。 

1/O 性 能 的 一 个 最 重要 的 度量 标准 是 磁盘 利用 率 (disk utilization) ， 即 测量 的 磁盘 忙于 处 理 1/0 请 
求 所 占 时 间 的 百分比 。 换 一 种 说 法 就 是 ， 磁 盘 利用 率 是 在 另 一 个 1/0 请 求 到 达 磁 盘 服务 队列 时 磁盘 忙 
的 概率 。 磁 盘 利 用 率 是 由 磁盘 速度 和 1/O 请 求 到 达 服务 队列 的 速率 决定 的 。 从 数学 上 表述 如 下 : 

利用 率 一 攻守 最 关 这 

这 里 ， 到 达 速 率 用 每 秒 钟 的 请 求 数 来 表示 ， 磁 盘 服 务 速度 则 用 每 秒 钟 的 1/O 操作 数 (IOPS) 表 
不 。 

例如 ， 考 虑 一 个 特定 的 磁盘 驱动 器 ， 它 可 以 在 15 ms 内 完成 一 个 7O 操作 。 这 意味 着 它 的 服务 束 
度 是 大 约 每 秒 67 个 I/O 操作 每 个 操作 0. 015 秒 = 每 秒 66. 7 个 操作 )。 如 果 这 个 磁盘 每 秒 可 以 得 到 
33 个 VO 请求， 那么 其 利用 率 大 约 是 50%。 在 实际 的 任何 系统 中 ，50% 的 利用 率 已 经 给 出 了 一 个 很 好 
的 磁盘 性 能 。 但 是 ， 如 果 这 个 系统 开始 发 现 有 一 个 持续 的 速度 为 每 秒 60 个 请 求 的 /O 请 求 速率 时 ， 又 
会 发 生 什么 情况 呢 ? 或 者 每 秒 64 个 请 求 呢 ?我 们 可 以 使 用 一 个 排队 理论 (queuing theory) 的 结果 来 
模拟 负载 增加 时 的 影响 。 简 单 地 说 ， 一 个 请 求 在 排队 上 所 花 的 时 间 直 接 与 服务 时 间 和 磁盘 人 忙 的 概率 有 
关 ， 并 且 间 接地 与 磁盘 空闲 的 概率 有 关 。 用 公式 表示 ， 有 : 


-| 《服务 时 间 X 利 用 率 ) 


通过 替代 ， 很 容易 看 到 当 一 个 VO 请 求 的 到 达 速 度 是 每 秒 60 个 请 求 ， 服 务 时 间 为 15ms 时 ， 系 统 
的 利用 率 是 90% 。 因 此 ， 一 个 请 求 将 不 得 不 在 队列 中 等 待 135 ms。 这 个 请 求 的 总 服务 时 间 就 是 135 十 
15 一 150 ms。 在 每 秒 有 64 个 请 求 时 〈 仅 增加 7%)， 完 成 请 求 所 需要 的 时 间 就 会 激增 到 370 ms (147% 
的 增加 ) 。 而 在 每 秒 65 个 请 求 时 ， 服 务 时 间 就 可 能 超过 了 半 秒 …… 这 哪里 是 15 ms 的 磁盘 处 理 器 ! . 
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从 上 面 的 公式 ， 可 以 得 出 排队 时 间 和 利用 率 的 关系 ， 如 图 10-1 所 示 。 从 图 中 可 以 看 到 ， 曲 线 的 
“ 膝 部 (knee)” (斜率 变化 最 大 的 位 置 ) 大 约 是 
78%。 这 就 是 为 什么 对 大 多 数 人 磁盘 驱 动 器 来 说 ，80% 
的 利用 率 是 经 验 法 则 的 上 限 。 

通过 这 个 模型 ,我 们 很 容易 看 到 事情 是 如 何 失去 
控制 的 。 如 果 我 们 有 一 个 持续 的 每 秒 68 个 1/O 请 求 
的 请 求 速率 ， 这 个 磁盘 就 会 变 得 不 堪 负 荷 。 如 果 其 中 010 
25% 的 请 求 产生 两 个 磁盘 操作 又 会 发 生 什 么 情况 呢 ? 
这 些 假想 的 情形 将 会 导致 更 加 复杂 的 模型 ， 但 是 这 个 
问题 的 最 终 解决 方案 在 于 找到 一 些 方法 将 服务 时 间 保 
持 在 一 个 绝对 的 最 低 值 。 这 也 正 是 磁盘 性 能 优化 所 要 


磁盘 排队 时 间 (ms) 


介绍 的 内 容 。 
0.04 
10.6.2 物理 性 能 
在 第 7 章 中 ， 我 们 介绍 了 确定 磁盘 物理 性 能 的 度 。 ““ 
景 机 制 。 这 些 度量 机 制 包括 旋转 延迟 (磁盘 转速 50 60 70 80 % 
RPM 的 一 个 函数 )、 寻 道 时 间 (磁头 辟 定 位 到 特定 磁 利用 率 百分比 


道 所 需 的 时 间 ) 和 传输 速率 〈 磁 盘 读 写 头 将 数据 从 磁 图 10-1 磁盘 队列 时 间 与 百分比 利用 率 的 关系 图 
盘 表 面 传 送 到 系统 总 线 的 速率 ) 。 旋 转 延 迟 时 间 和 寻 道 时 间 之 和 代表 了 磁盘 的 访问 时 间 。 

较 低 的 磁盘 访问 时 间 和 较 高 的 传输 速率 会 产生 较 低 的 总 服务 时 间 。 在 磁盘 上 增加 磁 碟 数 ， 或 者 在 
系统 上 增加 更 多 的 磁盘 数目 同样 也 可 以 降低 服务 时 间 。 在 WO 系统 上 增加 双 倍 的 磁盘 数 通 常 可 以 把 知 
吐 量 提高 50% 。 用 相同 数目 的 快速 磁盘 来 替换 现 有 的 磁盘 同样 可 以 得 到 显著 的 性 能 改善 。 例 如 ， 用 
10 000 RPM 的 磁盘 替换 7200 RPM 的 磁盘 可 以 带 来 10% 一 50% 的 性 能 提升 。 物 理 磁 盘 性 能 度量 标准 通 
常会 公开 在 由 磁盘 生产 三 家 所 提供 的 规格 说 明 书 上 。 因 此 ， 不 同 品牌 之 间 进 行 性 能 比较 ， 通 常 是 非常 
简单 的 事情 。 但 是 常言 道 ， 每 个 人 的 目标 是 不 同 的 。 磁 盘 性 能 的 提高 与 如 何 使 用 磁盘 以 及 磁盘 固有 的 
容量 密切 相关 。 原 始 的 磁盘 速度 是 有 其 限制 的 。 


10. 6. 3 逻辑 性 能 


有 时 ， 要 解决 慢 速 磁盘 系统 的 唯一 办 法 就 是 增加 磁盘 或 换 掉 磁 盘 。 但 是 这 一 步 又 只 是 在 所 有 其 他 
方法 都 失败 之 后 才 会 使 用 。 在 本 节 接 下 来 的 部 分 ， 我 们 讨论 一 些 有 关 磁 盘 的 逻辑 性 能 方面 的 知识 。 考 
虑 磁盘 性 能 中 的 逻辑 ， 可 以 对 磁盘 进行 调 校 和 调整 ， 而 这 些 磁盘 调整 的 任务 应 该 是 系统 操作 过 程 中 的 
一 种 例 行 的 工作 程序 。 


ey 





在 大 多 数 磁 盘 配 置 结构 中 ， 磁 盘 驱 动 臂 的 移动 是 花费 服务 时 间 最 大 的 部 分 。 平 均 旋 转 延 迟 ， 即 目 
标 扇 区 移动 到 读 写 头 下 所 需 的 时 间 ， 对 7200 RPM 的 磁盘 来 说 大 约 是 4 ms， 对 10 000 RPM 的 磁盘 来 
说 大 约 是 3 ms 〈 这 个 延迟 时 间 是 按照 磁盘 旋转 半 周 所 需 的 时 间 计算 的 ) 。 对 同类 型 的 磁盘 来 说 ， 平 均 
寻 道 时 间 ， 即 读 写 头 位 于 目标 磁道 上 所 需 的 时 间 ， 大 约 为 5 到 10 ms。 在 许多 情况 下 ， 这 个 时 间 是 磁盘 
旋转 延迟 时 间 的 两 倍 。 而且 ， 实 际 的 寻 道 时 间 可 能 比 平均 时 间 糟 糕 得 多 。 一 个 全 程 寻 道 (full-stroke 
seek) 时 间 (磁头 辟 从 最 里 面 的 磁道 到 最 外 面 的 磁道 ， 反 之 亦 然 〉 可 能 会 长 达 15 到 20 ms。 

很 显然 ， 改 善 磁盘 性 能 的 一 种 途径 就 是 找到 某 些 方法 来 减少 磁头 臂 的 移动 。 这 个 方法 可 以 通过 优 
化 访问 服务 磁盘 的 扇 区 顺序 来 实现 。 磁 盘 调 度 (disk scheduling) 可 以 是 磁盘 控制 器 的 功能 ， 也 可 以 由 
主机 操作 系统 负责 处 理 ， 但 是 它 不 应 该 由 这 两 者 同时 来 完成 。 因 为 两 者 同时 操作 可 能 会 发 生 调 度 冲突 ， 
反而 降低 磁盘 的 吞吐 量 。 





性 能 度量 和 分 新 333 








使 用 最 多 的 磁盘 调度 策略 是 先 来 先 服务 (first-come，first-served，FCFS) 的 方案 。 顾 名 思 义 ， 所 
有 1/O 请 求 都 是 按照 它们 到 达 磁 盘 服务 队列 的 顺序 来 服务 的 。 理 解 这 个 问题 的 最 简单 办 法 是 列举 一 个 
例子 。 假 设 有 某 个 磁盘 有 100 个 磁道 ， 编 号 从 0 到 99。 在 这 个 系统 运行 的 程序 进程 是 按照 如 下 的 顺序 
发 出 请 求 从 磁盘 中 读 取 磁道 : 

28，35，52，6，46，62，19，75，21 

在 FCFS 调度 策略 下 ， 假 设 当前 正在 的 服务 磁道 是 第 40 号 磁道 ， 则 磁头 臂 移 动 的 踪迹 如 图 10-2 所 
示 。 从 图 中 可 以 看 出 ， 磁 头 臂 的 运动 方向 改变 踪迹 10 20 30 4 50 60 70 80 9 
了 6 次， 在 完成 这 一 系列 请 求 的 过 程 中 一 共 遍 
历 了 291 个 磁道 。 

可 以 肯定 ， 如 果 对 这 些 请 求 进行 排序 ， 使 
得 磁头 辟 每 次 都 只 移动 到 距离 当前 位 置 最 近 的 
磁道 ， 那 么 可 以 大 大 减少 磁头 辟 移 动 。 最 短 寻 
道 时 间 优 先 (shortest seek time first，SSTF) 
的 调度 算法 就 是 采用 了 这 种 思想 。 对 于 上 面 所 
列 出 的 相同 的 磁道 请 求 ， 使 用 SSTF 磁盘 调度 
系统 将 会 按 如 下 顺序 执行 ， 

35, 28, 21, 19, 6, 46, 52, 62, 75 

这 种 调度 的 模式 如 图 10-3 所 示 。 可 以 看 
出 ， 磁 头 臂 的 方向 仅 改变 了 一 次 ， 共 遍历 了 
103 个 磁道 。SSTF 的 一 个 缺点 是 有 可 能 发 生 饥 饶 现 象 (资源 缺乏 ，starvation) ， 理 论 上 ， 只 要 有 磁道 
更 接近 当前 磁道 位 置 的 请 求 达到 ， 在 磁盘 “ 远 辆 渤 10 20 30 40 50 60 70 80 9% 
端 ”部 分 的 请 求 磁道 将 会 一 直 排 在 队列 的 最 后 
位 置 。 有 趣 的 是 ， 这 个 问题 是 磁盘 利用 率 低 的 
最 糟糕 的 情况 。 

为 了 避免 SSTF 的 饥 狐 风险， 必须 在 系统 
中 设计 一 些 公平 的 机 制 。 为 此 ， 采 用 的 一 个 简 
单 的 方法 是 让 磁头 壁 在 磁盘 表面 继续 扫描 ， 直 
到 到 达 磁 盘 服 务 队列 中 存在 的 某 个 请 求 磁道 时 
停 上 。 这 种 方法 被 称 为 电梯 算法 《elevator 
algorithm) ， 因 为 它 与 摩天 大 楼 里 的 电梯 载 人 
服务 的 情况 很 相似 。 在 磁盘 调度 上 下 文中 ， 电 
梯 算 法 被 大 家 称 为 SCAN (不 是 缩写 ) 。 下 面 
将 通过 一 个 例子 来 描述 SCAN 是 如 何 工作 的 。 
假设 磁头 车 碰巧 定位 在 40 号 磁道 ， 并 正在 向 磁盘 内 部 扫描 更 大 编号 数 的 磁道 。 现 在 利用 与 前 面相 同 的 
请 求 队列 ，SCAN 会 按 下 面 的 顺序 读 取 磁 道 : 

46, 52,62, 75, 35, 28, 21, 19, 6 

磁头 臂 在 读 取 第 75 号 和 第 35 号 磁道 之 间 会 经 过 第 99 号 磁道 ， 然 后 在 读 完 第 6 号 磁道 后 移动 到 第 
0 号 磁道 ， 如 图 10-4 所 示 。SCAN 有 一 种 变 体形 式 ， 称 为 C-SCAN， 即 循环 的 SCAN。 在 这 种 办 法 中 ， 
第 0 号 磁道 会 被 认为 是 第 99 号 磁道 相 邻 磁道 。 换 句 话 说， 磁头 臂 只 沿 一 个 方向 读 取 ， 如 图 10-5 所 示 。 
一 旦 经 过 了 第 99 号 磁道 后 ， 磁 头 又 会 返回 到 第 0 号 磁道 。 因 此 ， 在 本 例 中 ，C-SCAN 方法 按 如 下 的 顺 
序 读 取 磁道 ; 

46, 52, 62, 75, 6, 19, 21, 28, 35 

我 们 甚至 还 可 以 使 用 LOOK 和 C-LOOK 算法 ， 进 一 步 减少 SCAN 和 C-SCAN 方法 中 的 磁头 辟 移 





时 间 


图 10-2 使 用 先 来 先 服务 的 磁盘 调度 策略 
的 寻 道 轨迹 示意 图 





图 10-3 使 用 最 短 寻 道 时间 优 先 调度 算法 的 
磁头 臂 移动 示意 图 
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动 。 在 本 例 中 ，SCAN 和 C-SCAN 继续 扫 过 所 有 的 100 个 磁道 。 但 是 ， 事 实 上 ， 请 求 的 磁道 的 编号 最 
低 为 6， 最 高 为 75。 因 此 ， 如 果 磁 头 臂 在 读 轴 迹 10 20 30 40 50 60 70 80 9 

取 最 高 编号 和 最 低 编号 的 磁道 后 就 改变 方向 ， 

那么 磁头 臂 共 只 需要 遍历 69 个 磁道 。 这 样 就 
可 以 在 SCAN 和 C-SCAN 算法 的 基础 上 再 节 
省 大 约 30% 的 磁头 辟 移 动 。 

有 趣 的 是 ， 在 高 利用 率 的 情况 下 ，SSTF 
会 比 SCAN 或 LOOK 完成 的 效果 稍微 好 一 
些 。 但是， 依然 存在 某 个 单独 的 请 求 出 现 饥 
钱 的 风险 。 在 非常 低 的 利用 率 〈 低 于 20%) 
情况 下 ， 所 有 这 些 算法 的 性 能 都 是 可 接 
受 的 。 

鉴于 前 面 磁盘 调度 算法 的 讨论 ， 这 里 简 
单 讨论 一 下 有 关 文 件 的 顺序 存放 问题 。 如 果 
把 使 用 率 最 高 的 文件 存放 在 磁盘 的 中 心 区 域 将 可 以 实现 最 大 的 磁盘 性 能 。 这 一 点 对 于 磁盘 目录 和 存储 
器 页 面 (交换 ) 文件 来 说 特别 重要 .中心 位 i,。 
置 的 磁头 移动 是 最 少 的 ， 因 此 对 SSTF 和 轩 
SCAN/LOOK 算法 来 说 ， 都 能 达到 最 佳 的 访 
间 时 间 。 当 文件 非常 零碎 时 磁盘 性 能 最 差 ， 即 
文件 被 存放 在 多 个 不 连续 的 磁盘 位 置 。 如 果 这 
个 磁盘 使 用 SCAN/LOOK 调度 方法 ， 那 么 在 
找到 文件 的 尾部 时 ， 可 能 需要 经 历 多 个 磁头 全 
程 移动 。 因 为 这 样 ， 磁 盘 应 该 进行 碎片 整理 
(Cdefragmented) ， 或 者 是 在 某 种 规则 基础 上 进 
行 重组 。 此 外 ， 和 磁盘 不 应 该 太 满 。 另 外 一 个 经 





图 10-4 使 用 SCAN 磁盘 调度 算法 的 
磁头 臂 移动 的 示意 图 
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验 规则 就 是 当 磁 盘 容 量 达到 80% 时 ， 要 开始 图 10-5 使 用 C-SCAN 磁盘 调度 算法 的 
考虑 移 走 一 些 文件 。 如 果 没 有 文件 可 以 移动 . 磁头 臂 移 动 的 示意 图 
就 需要 增加 一 个 新 磁盘 。 


筑 红 级 存 和 顶 取 

的 确 ， 减 少 磁 头 臂 移动 的 最 好 方式 是 尽 可 能 避免 使 用 磁盘 达到 磁盘 的 最 大 可 能 范围 。 为 此 ， 许 多 
磁盘 驱动 器 ,或 者 磁盘 驱动 器 的 控制 器 ， 都 配 有 高 速 缓存 存储 器 。 这 个 高 速 缓存 存储 器 可 以 通过 留 出 
一 些 主 存储 器 的 页 面 作为 1O 子 系统 专用 。 磁 盘 高 速 缓存 通常 是 关联 高 速 缓存 。 因 为 关联 高 速 缓存 的 
搜索 稍微 有 点 费时 ， 所 以 使 用 较 小 的 磁盘 高 速 缓存 的 实际 性 能 可 能 会 更 好 一 些 ， 原 因 是 磁盘 高 速 缓存 
的 命中 率 通常 会 比较 低 。 

用 于 IO 子 系统 的 主 存储 器 页 面 适 合作 为 磁盘 的 二 级 高 速 缓存 。 在 大 型 服务 器 中 ， 为 此 目的 所 留 
出 的 页 面 数目 是 一 个 可 调 的 系统 参数 。 如 果 主 存储 器 的 利用 率 很 高 ， 分 配给 IO 子 系统 的 页 面 数 就 必 
须 减 少 。 否 则 ， 将 会 导致 过 多 的 页 面 出 错 〈 缺 页 ) 数目 ， 这 会 破坏 使 用 主 存储 器 作为 /0 子 系统 高 速 
缓存 的 整体 目标 。 

主 存储 器 的 I/O 高 速 缓存 可 以 通过 运行 在 主机 上 的 操作 系统 软件 进行 管理 ， 或 者 由 产生 1/O 请 求 
的 应 用 程序 进行 管理 。 应 有 级 的 高 速 缓存 管理 通常 可 以 提供 优越 的 性 能 ， 因 为 这 种 方式 可 以 利用 应 用 
程序 的 特定 参数 。 最 好 的 应 用 程序 可 以 为 用 户 提供 对 1/O 高 速 缓存 规模 大 小 的 某 些 控制 ， 这 样 可 以 针 
对 主机 存储 器 的 利用 率 来 调整 高 速 缓存 的 大 小 ， 防 止 出 现 过 多 的 页 面 错误 〈 缺 页 率 ) 。 
许多 基于 磁盘 驱动 器 的 高 速 缓存 都 使 用 预 取 〈prefetching) 技术 来 减少 磁盘 的 访问 。 从 概念 上 来 
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说 ， 预 取 和 CPU 到 存储 器 (CPU-to-memory) 的 高 速 缓存 非常 相似 : 它们 都 是 利用 局 部 性 原理 来 获得 
更 好 的 性 能 。 当 使 用 预 取 技 术 时 ， 会 同时 读 取 磁 盘 中 包含 目标 扇 区 的 后 续 的 若干 个 扇 区 ， 并 且 期 望 其 
中 一 个 或 多 个 后 续 扇 区 不 久 就 会 成 为 所 需求 的 扇 区 。 经 验 研究 表明 ， 超 过 50% 的 磁盘 访问 性 质 上 是 顺 
序 访问 。 平 均 来 说 ， 预 取 技 术 可 以 提升 40% 的 性 能 。 

预 取 技术 的 缺点 是 存在 高 速 缓存 污染 (Cache pollution) 现象 。 如 果 高 速 缓 存 中 被 填 满 一 些 没有 任 
何 进程 所 需 的 数据 时 ， 就 发 生 了 高 速 缓存 污染 ， 这 样 为 有 用 的 数据 留 下 的 空间 就 非常 少 了 。 在 使 用 主 
存储 器 高 速 缓存 时 ， 可 以 使 用 各 种 不 同 的 置换 算法 来 保持 高 速 缓存 的 清洁 。 这 些 策略 包括 在 CPU 到 存 
储 器 的 高 速 缓存 中 使 用 置换 算法 (例如 ，LRU、LFU 和 随机 置换 算法 )。 另 外 ， 由 于 磁盘 高 速 缓存 用 
作 写 人 磁盘 的 数据 的 转运 站 ， 所 以 某 些 磁盘 高 速 缓存 的 管理 方案 是 在 高 速 缓存 中 的 数据 被 写 人 磁盘 后 ， 
简单 地 清除 磁盘 高 速 缓存 中 的 所 有 数据 字 节 。 

从 磁盘 中 读 取 数 据 和 向 磁盘 写 和 数据 这 两 种 操作 在 本 质 上 存在 的 差别 会 引发 了 一 些 非常 环 手 的 
高 速 缓存 问题 。 首 先 也 是 最 重要 的 问题 是 高 速 缓存 是 一 种 易 失 性 的 存储 器 。 在 一 个 大 规模 的 系统 失 
效 事件 中 ， 高 速 缓存 中 的 数据 将 会 丢失 。 假 设 某 个 运行 在 主机 上 的 应 用 程序 认为 数据 已 经 提交 到 了 
磁盘 ， 但 是 实际 上 这 些 数据 只 是 驻 留 在 高 速 缓存 中 。 如 果 高 速 缓存 失效 ， 这 些 数据 也 就 消失 了 。 当 
然 ， 这 种 情况 可 能 引起 严重 的 数据 不 一 致 问题， 例如 一 个 ATM 机 器 在 没有 登记 账目 的 情况 下 就 给 
顾客 付 了 款 。 

为 了 防止 由 于 断 电 而 造成 高 速 缓存 的 数据 丢失 ， 一 些 基 于 磁盘 控制 器 高 速 缓 存 通 常 都 使 用 镜像 
(mirrored) 高 速 缓存 ， 并 且 提 供电 池 作 为 备份 电源 。 当 对 高 速 缓存 进行 镜像 映射 时 ， 磁 盘 控制 器 会 有 
两 个 采用 前 后 串联 方式 的 完全 相同 的 高 速 缓存 在 工作 ， 这 两 个 高 速 缓存 在 任何 时 刻 都 保存 相同 的 数据 。 
另 一 种 途径 是 采用 在 第 6 章 中 讨论 的 写 通 〈write-through) 高 速 缓存 。 在 这 种 高 速 缓存 中 会 保留 一 份 
数据 副本 ， 以 防止 这 些 数 据 “ 不 久 ” 会 再 次 需要 ， 但 同时 这 些 数据 也 会 被 写 人 到 磁盘 中 。 操 作 系统 只 
会 在 数据 已 经 实际 存放 在 磁盘 上 后 ， 才 发 出 MO 已 经 完成 的 信号 。 因 此 ， 为 了 获得 更 好 的 可 靠 性 ， 通 
常 需 要 在 一 定 程 度 上 进行 系统 性 能 平衡 。 

当 系统 的 吞吐 量 比 可 靠 性 更 重要 时 ， 可 以 采用 回 写 高 速 缓存 策略 。 读 者 不 妨 回忆 一 下 ， 实 际 上 有 
两 种 类 型 的 回 写 策略 。 最 简单 的 方法 是 磁盘 周期 性 地 读 取 高 速 缓存 〈 通 常 一 分 钟 读 两 次 )， 并 将 所 找到 
的 所 有 的 脏 数 据 块 写 人 磁盘 。 如 果 主 要 关心 的 是 系统 的 可 靠 性 ， 那 么 可 以 将 提交 数据 的 间隔 时 间 变 得 
更 短 (以 牺牲 性 能 为 代价 )。 一 个 更 加 复杂 的 回 写 算法 是 采用 机 会 《opportunistic) 写 人 。 使 用 这 种 方 
法 ， 脏 数据 块 会 一 直 在 高 速 缓存 中 等 待 ， 直 到 有 一 个 位 于 同一 磁道 柱 面 的 读 请 求 到 来 。 接 着 ,在读 操 
作 时 会 进行 “ 捕 带 确认 (piggybacked)” 的 写 和 操作。 这 种 方法 会 对 磁盘 的 读 性 能 的 降低 产生 影响 ， 
但 是 对 写 性 能 会 有 帮助 。 许 多 系统 都 采用 周期 回 写 和 机 会 回 写 这 两 种 策略 的 组 合 形式 ， 以 设法 在 效率 
和 可 靠 性 之 间 达 到 某 种 平衡 。 

在 优化 磁盘 性 能 方面 ， 这 些 平 衡 性 能 的 折 囊 方案 常常 会 面临 一 些 非 常 困难 的 选择 。 我 们 的 首要 责 
任 是 要 确保 数据 的 可 靠 性 和 一 致 性 。 但 是 ， 如 果 使 用 易 失 性 高 速 缓存 来 补偿 访问 磁盘 时 间 的 延迟 ， 能 
够 实现 最 大 的 吞吐 量 。 使 用 电池 备份 的 高 速 缓存 的 成 本 非常 高 。 增 加 磁盘 数 来 提高 吞吐 量 同 样 也 是 一 
种 昂贵 的 选择 。 如 果 从 磁盘 写 操作 中 移 去 高 速 缓存 这 个 中 间 介 质 可 能 会 导致 磁盘 性 能 的 降低 ， 特 别 是 
在 磁盘 利用 率 高 的 情况 下 。 用 户 很 快 就 会 抱怨 过 长 的 磁盘 反应 时 间 ， 而 当 你 为 磁盘 升级 向 财务 人 员 申 
请 经 费时 ， 他 们 也 会 抱怨 费用 太 高 。 需 要 牢记 的 是 ， 不 管 新 磁盘 的 价格 如 何 ， 升 级 磁盘 子 系统 通常 比 
替换 丢失 的 数据 要 合算 得 多 。 


本 章 小 结 


本 章 介绍 了 有 关 计 算 机 性 能 的 两 个 方面 的 内 容 : 性 能 评价 和 性 能 优化 。 通 过 本 章 的 学 习 ， 读 者 应 该 了 
解 一 些 计算 机 性 能 的 关键 测量 方法 ， 并 能 够 正确 地 总 结 和 归纳 这 些 方 法 。 特 别 是 读者 应 该 理解 算术 平均 值 
对 高 度 变化 的 数据 并 不 合适 ， 而 且 不 应 该 使 用 在 速率 和 比率 的 测评 上 。 对 于 高 度 变 化 的 数据 ， 几 何平 均值 
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非常 有 用 。 但 是 ， 几 何平 均值 不 能 用 来 预测 性 能 。 调 和 平均 值 在 比较 速率 时 很 适合 ， 而 且 也 是 一 个 有 用 的 
性 能 预测 器 。 但 是 ， 如 果 使 用 调和 平均 值 来 比较 系统 的 相对 性能， 那么 调和 平均 值 在 选择 参考 机 器 时 要 比 
几何 平均 值 更 加 敏感 。 

本 章 我 们 解释 了 一 些 非 常 流行 的 基准 程序 和 套件 。 在 这 些 基准 中 ， 最 可 靠 的 是 由 像 SPEC 和 TPC 这 样 
的 公平 监管 的 组 织 所 颁布 和 管理 的 基准 。 不 管 使 用 哪 种 基准 ， 都 应 该 按照 用 户 特 定 的 应 用 内 容 对 基准 程序 
进行 解释 。 记 住 ， 没 有 一 个 单一 的 度量 标准 能 够 对 所 有 的 情况 都 通用 。 

计算 机 性 能 直接 依赖 于 计算 机 组 件 的 优化 。 这 里 ， 我 们 仔细 研究 了 影响 计算 机 系统 组 件 主 要 性 能 的 各 
种 因素 。Amdahl 定律 为 我 们 提供 了 一 种 方法 ， 利 用 Amdahl 定律 可 以 确定 各 种 不 同 的 优化 技术 可 以 获得 的 
潜在 的 系统 性 能 的 加 速率 。 而 且 ，Amdahl 定律 也 为 性 能 增强 的 可 能 性 设置 了 一 个 上 限 。 性 能 优化 需要 考 
虑 的 内 容 包 括 CPU 性 能 、 存 储 器 性 能 和 I/O 性 能 。CPU 性 能 与 程序 代码 、 编 译 器 技术 、 指 令 系 统 (ISA) 
和 硬件 技术 密切 相关 。 分 支 指令 对 流水 线 的 性 能 有 重大 影响 ， 进 而 对 CPU 性 能 产生 很 重要 的 影响 。 分 支 预 
测 是 一 种 补偿 由 于 分 支 转移 所 带 来 的 程序 执行 复杂 性 的 方法 。 固 定 分 支 预 测 和 静态 分 支 预测 方法 都 没有 动 
态 技术 准确 ， 但 是 它们 实现 的 成 本 也 比较 低 。 

IO 性 能 同时 是 磁盘 驱动 器 逻辑 特性 和 物理 特征 的 函数 。 只 要 不 更 换 硬件 ， 就 无 法 改善 磁盘 系统 的 物 
理性 能 。 但 是 ， 仍 然 可 以 对 磁盘 的 很 多 逻辑 性 能 进行 调整 和 优化 。 这 些 因 素 包 括 磁 盘 利 用 率 ， 文 件 存放 位 
置 ， 以 及 存储 器 高 速 缓存 的 大 小 。 好 的 性 能 报告 工具 不 仅 可 以 提供 完整 的 IO 统计 数据 ， 而 且 可 以 提供 各 
种 调整 方案 的 建议 。 : 

系统 性 能 的 评估 和 优化 是 系统 管理 人 员 的 两 项 最 重要 的 任务 。 在 本 章 中 ， 我们 只 是 介绍 了 一 些 与 系统 

台 无 关 的 知识 内 容 。 最 有 帮助 和 最 有 趣 的 信息 可 以 在 计算 机 系统 制造 厂商 所 提供 的 各 种 手册 和 培训 研讨 
会 中 获取 。 这 些 资源 对 于 读者 继续 从 事 调整 系统 的 有 效 性 的 工作 是 很 重要 的 。 
深入 阅读 

在 整体 计算 机 设计 方面 ，Hennessy 和 Patterson (1996) 介绍 了 计算 机 性 能 。 他 们 的 书 中 包含 了 有 关 计 
算 机 体系 结构 性 能 的 各 个 方面 的 内 容 ， 这 本 书 的 处 理 手法 受到 大 家 的 好 评 。Lija (2000) 的 著作 覆盖 了 系 
统 度量 方法 的 设计 和 分 析 ， 对 计算 机 性 能 有 一 个 全 面 的 介绍 。 这 本 书 中 所 介绍 的 数学 评估 方法 ， 思 想 特别 
清晰 ， 可 读 性 很 强 。 要 了 解 高 性 能 计算 的 详细 信息 ， 出 色 的 编程 和 调整 软件 ， 以 及 基准 等 知识 ， 可 以 参阅 
Severance 和 Dowd (1998) 的 书籍 。Musumeci 和 Loukides (2002) 的 著作 也 同样 非常 好 地 介绍 了 有 关系 统 
性 能 调整 方面 的 知识 。 

除了 上 面 介绍 的 参考 书 外 ，Fleming 和 Wallace (1996) 和 Smith (1998) 的 论文 则 讨论 了 如 何 选择 正 
确 的 统计 方法 的 数学 基础 。 并 且 对 某 些 有 争议 的 性 能 度量 标准 提出 了 自己 的 一 些 深入 见解 。 

在 本 书 有 关 统 计 方 法 的 缺陷 和 雍 论 的 讨论 过 程 中 ， 没 有 涉及 到 统计 学 的 图 形 表 示 方 法 ， 这 种 方法 也 会 
产生 一 些 不 正确 的 结论 和 假设 。 如 果 希 望 了 解 如 何 利用 图 形 工具 来 传递 《和 遮 散 ) 各 种 统计 信息 的 艺术 ， 
推荐 读者 完整 地 阅读 Tufte (2001) 的 著作 。 读 者 在 阅读 之 余 肯 定 会 有 惊奇 、 欣 喜 和 困惑 等 滋味 。 这 里 ， 还 
推荐 Huff (1993) 经 典 著作 。 这 本 薄 薄 的 书籍 (第 一 版 于 1954 年 发 行 ) 中 的 各 种 资料 和 插图 已 经 为 读者 
服务 了 50 多 年 。 

Price (1989) 的 文章 很 好 地 介绍 了 许多 早期 的 综合 基准 ， 包 括 Whetstone、Dhrystone 和 许多 其 他 在 本 
章 中 没有 提 到 的 基准 。Serlin (1986) 的 文章 是 另外 一 篇 全 面 介 绍 早 期 基准 的 文章 。Weicker (1984) 的 文 
章 包含 对 他 自己 的 Dhrystones 基准 的 最 原始 的 介绍 。Grace (1996) 的 著作 则 是 描述 每 种 主要 基准 的 百科 全 
书 。 这 本 书 中 包括 了 本 章 中 讨论 的 所 有 基准 和 许多 其 他 基准 ， 甚 至 包括 针对 Windows 和 Unix 环境 的 专用 
基准 。 

令 人 奇怪 的 是 ， 从 标准 基准 程序 中 得 到 MFLOPS 数字 与 从 早期 的 浮 点 SPEC 基准 得 到 数字 有 很 强 的 
相关 性 。 在 Giladi (1996) 的 文章 中 对 这 个 异常 现象 做 了 很 好 的 讨论 ， 而 且 这 篇 文章 也 同样 提供 了 有 关 
Linpack 浮 点 基准 的 详细 讨论 。 现 在 ， 有 关 SPEC 基准 的 完整 信息 可 以 在 SPEC 的 站 点 www. spec. org 上 
找到 。 
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对 于 TPC 基准 来 说 ， 开 创 性 的 文章 是 由 Jim Gray (1985) 匿名 发 表 的 。 他 把 这 个 荣誉 赠与 了 许 许多 多 对 这 篇 
文章 的 最 后 成 型 有 影响 的 其 他 人 ， 他 曾经 将 他 的 文章 给 上 千 人 传阅 以 争 求 他 们 的 意见 。 他 拒绝 使 用 个 人 的 著作 
权 ， 并 且 匿 名 发 表 这 篇 文章 。 因 此 ， 许 多 人 在 引用 这 篇 文章 时 都 是 用 “Anon. ，et al”。 这 篇 文章 给 出 了 事务 处 理 
委员 会 的 背景 和 基本 思想 。 现 在 ， 在 TPC 的 网 站 www. tpc. org 可 以 找到 更 多 的 信息 。 

Hsu、Smith 和 Young (2001) 在 文章 中 详细 地 研究 了 使 用 真实 的 工作 量 对 各 种 TPC 基准 的 比较 。 这 
篇 文章 也 展示 了 使 用 跟踪 分 析 方 法 搜集 到 的 各 种 性 能 数据 。 

有 关 1/QO 系统 性 能 方面 的 介绍 也 有 大 量 的 资料 。 在 Hennessy 和 Patterson (1996) 的 书 中 就 详细 讨论 
了 这 个 问题 。 有 关 磁 盘 调度 策略 的 研究 (虽然 有 些 过 时 ) 可 以 参阅 Oney (1975) 的 论文 。Karedla、Love 
和 Wherry (1994) 的 文章 则 对 磁盘 高 速 缓存 的 性 能 做 了 清晰 和 详细 的 讨论 。Reddy (1992) 对 1/O 系统 体 
系 结构 做 了 很 好 的 全 面 回顾 。 


参考 文献 


Fleming, Philip J.. & Wallace .john J. “How Not to Lie with Statistics: The Correct Way to Sum- 
marize Benchmark Results.” Communications of the ACM 29:3 (March 1996)， pp. 218-221. 


Giladi, Ran. “Evaluating the MFLOPS Measure.” IEEE Micro. (August 1996)， pp. 69—75. 
Grace, Rich. The Benchmark Book. Upper Saddle River, NJ: Prentice Hall. 1996. 
Gray. Jim, et al. “A Measure of Transaction Processing Power.” Datamation 31:7 (1985). pp. 112-118. 


Hennessy, john L., & Patterson, David A. Compurer Architecture: A Quantitative Approach. San 
Francisco: Morgan Kaufmann Publishers. 1996. 


Hsu, Windsor W., Smith, Alan Jay, & Young. Honesty C. “1/O Reference Behavior of Production 
Database Workloads and the TPC Benchmarks 一 An Analysis at the Logical Level.” ACM 
Transactions on Database Systems 26:1 (March 2001). pp. 96 一 143. 


Huff. Darrell. How to Lie with Statistics. New York: W.W. Norton & Company,. 1993. 


Karedla, Ramakrishna, Love. J. Spencer, & Wherry. Bradley G. “Caching Strategies to Improve 
Disk System Performance.” [EEE Compurer (March 1994). pp. 38 46. 


Lilja, David 4. Measuring Computer Performance: A Practitioner's Guide. New York: Cambridge 
University Press, 2000. 


Musumeci, Gian-Paolo, & Loukides, Mike. System Performance Tuning. 2nd ed. Sebastopol. CA: 
OReilly & Associates, Inc.. 2002. 


Oney, Walter C. “Queueing Analysis of the Scan Policy for Moving-Head Disks.” Journal of the 
ACM 22 (July 1975). pp. 397-412. 


Price, Walter J. “A Benchmarking Tutorial JEEE Microcomputer (October 1989). pp. 28-43. 


Reddy. A. L. Narasimha. “A Study of VO System Organization.™ ACM SIGARCH Proceedings of the 
191h Annual International Symposium on Computer Architecture 20:2 (April 1992). pp. 308-317， 


Serlin. Omri. “MIPS. Dhrystones. and Other Tales.™ Daiamation. June 1. 1986. pp. 112-118. 


Severance. Charles. & Dowd, Kevin. High Performance Computing. 2nd ed. Sebastopol. CA: 
O'Reilly & Associates, Inc.. 1998. 


Smith, James E. “Characterizing Computer Performance with a Single Number.” Communications 
of the ACM 32:10 (October 1998). pp. 1202-1206. 


Tufte, Edward R. The Visual Display of Quantitative Information. 2nd ed. Cheshire. CT: Graphics 
Press, 2001. 


Weicker, Reinhold P. “Dhrystone: A Synthetic Systems Programming Benchmark.™ Communica- 
rions of the ACM 27 (October 1984), pp. 1013-1029. 


Weicker, Reinhold P. “An Overview of Common Benchmarks.” JEEE Computer (December 1990)“ 
Pp. 65-75. 


338 第 10 章 


基本 概念 和 术语 复习 


-2. 
3 


解释 程序 或 系统 属于 存储 器 约束 的 含义 。 本 章 还 讨论 了 其 他 什么 类 型 的 约束 ? 
关于 性 能 优化 ，Amdahl 定律 告诉 了 我 们 什么 ? 
对 于 比较 速率 ， 哪 种 平均 值 方法 最 有 用 ? 


. 什么 类 型 的 数据 使 用 算术 平均 值 不 合适 ? 


给 出 一 个 最 佳 性 能 (optimum performance) 的 定义 。 
什么 是 性 价 比 ? 什么 原因 使 得 它 很 难 应 用 ? 
使 用 MIPS 或 FLOPS 作为 系统 吞吐 量 (处 理 能 力 ) 的 度量 手段 有 什么 缺点 ? 


. Dhrystone 基准 与 Whetstone 和 Linpack 基准 之 间 有 什么 区 别 ? 


针对 SPEC 的 CPU 基准 来 说 ，Whetstone、Dhrystone 和 Linpack 基准 有 什么 不 足 之 处 ? 

. 解释 术语 基准 测试 (benchmarking) 。 

. TPC 重点 关注 的 问题 和 SPEC 有 什么 不 同 ? 

. 解释 延迟 分 支 转移 (delayed branching ) 。 

. 什么 是 分 支 预测 ?分 支 预测 用 来 做 什么 ? 

. 列举 三 种 流水 线 冒险 的 例子 。 

. 定义 下 列 术语 ; 循环 并 合 (loop fusion)、 循 环 分 折 (loop fission) 、 循 环 和 剥离 (loop peeling) 和 循环 交 
换 (loop interchange) 。 

. 按照 排队 理论 ， 临 界 磁盘 百分比 利用 率 是 多 少 ? 

- 在 使 用 SSTF 磁盘 调度 算法 中 会 遇 到 什么 风险 ? 

LOOK 和 SCAN 算法 有 什么 不 同 ? 

. 什么 是 磁盘 预 取 ? 它 有 什么 优点 和 缺点 ? 

. 使 用 高 速 缓存 的 磁盘 写 入 方式 有 什么 优点 和 缺点 ? 


练习 题 


$1. 


表 10-2 表示 的 是 两 台 计 算 机 系统 A 和 系统 C 的 任务 执行 组 合 和 程序 运行 时 间 。 在 这 个 例子 中 ,系统 C 
比 系统 A 快 83%。 表 10-3 描述 的 是 系统 A 使 用 不 同 的 任务 执行 组 合 时 的 程序 运行 时 间 。 利 用 表 10-3 给 
出 的 执行 组 合 ， 计 算出 系统 C 比 系统 A 快 的 百分比 。 与 表 10-2 中 的 原始 统计 数据 相 比较 ， 系 统 A 在 新 
的 执行 组 合 条 件 下 ， 性 能 下 降 了 多 少 ? 


. 利用 第 10. 3 节 中 针对 程序 v、w、z、y 和 xz 所 引用 的 性 能 数据 ， 求 出 这 些 程序 在 系统 B 和 系统 C 上 的 运 


行 时 间 的 几何 平均 值 ， 计 算 中 选取 系统 A 作为 一 个 参考 机 器 。 证 明 这 个 平均 值 比值 和 选取 其 他 两 个 系统 
作为 参考 系统 所 得 到 的 结果 一 致 。 


. 在 下 表 中 给 出 了 3 个 系统 运行 5 个 基准 的 执行 时 间 。 分 别 使 用 算术 平均 值 和 几何 平均 值 比较 这 些 系统 之 


间 的 相对 性 能 ( 即 ，A 比 B，B 比 C 和 A 比 C)。 是 否 有 奇怪 的 现象 ? 请 解释 原因 。 


. 下 表 中 给 出 了 3 个 系统 运行 5 个 基准 的 执行 时 间 。 分 别 使 用 算术 平均 值 和 几何 平均 值 比较 这 些 系统 之 间 


的 相对 性 能 〈 即 ，A 比 B，B 比 C 和 A 比 C)。 是 否 有 奇怪 的 现象 ? 请 解释 原因 。 
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5. 一 家 销售 数据 库 管理 优化 软件 的 公司 与 你 联系 ， 想 推销 产品 。 公 司 的 销售 代表 声称 这 个 存储 器 管理 软件 
可 以 降低 系统 的 页 面 出 错 率 ( 缺 页 率 )。 她 给 你 提供 这 个 软 
件 的 30 天 的 免费 试用 期 。 但 是 ， 在 安装 该 软件 之 前 ， 你 决 
定 首先 为 系统 确定 一 个 基准 线 。 在 这 天 的 菜 个 特定 的 时 间 ， 
你 对 系统 进行 了 采样 ， 并 记录 页 面 出 错 率 使 用 这 个 系统 


的 诊断 软件 )。 在 安装 该 管理 软件 之 后 ， 你 又 做 了 同样 的 诊 | 10:00 一 11:00 42% 38% 
断 。 请 问 ， 这 个 新 的 管理 软件 所 带 来 的 系统 的 平均 性 能 提 | 13:00 一 14:00 12% 10% 

18:00—19:00| 20% | 22% | 
出 错 率 和 诊断 时 间 如 右 表 所 示 : 


高 是 多 少 ? 

6. 使 用 像 Whetstone 和 Dhrystone 之 类 的 综合 基准 有 什么 限制 ? 你 认为 能 否 扩展 综合 基准 的 这 些 概 念 以 克 
服 这 些 限制 ? 解释 你 的 答案 。 

多 7. 如 果 供 应 商 声称 其 系统 运行 50% 的 SPEC 的 基准 内 核 程序 要 比 它 的 主要 竞争 系统 快 两 倍 ， 你 会 怎样 认 
为 ? 这 里 出 现 了 什么 样 的 统计 廖 论 ? 

8. 假设 你 正在 进行 调查 准备 购买 一 个 新 的 计算 机 系统 。 除 了 系统 X 的 型 号 Q 外 ， 你 已 经 知道 了 所 考虑 的 
所 有 系统 基准 结果 。 但 是 你 有 系统 X 的 型 号 S 的 基准 结果 ， 而 且 这 些 结果 没有 其 他 一 些 竞争 品牌 的 性 能 
好 。 为 了 完成 调查 研究 ， 你 打 电话 到 系统 X 的 计算 机 公司 ， 问 他 们 计划 何 时 公布 型 号 Q 的 测试 结果 。 
他 们 告诉 你 近期 不 会 公布 这 些 结果 ， 但 是 因为 型 号 Q 的 磁盘 驱动 器 的 平均 访问 时 间 是 12ms， 而 型 号 S 
为 15ms， 所 以 型 号 Q 的 性 能 将 比 型 号 S 的 性 能 高 出 25% 。 你 怎样 评价 系统 X 的 型 号 Q 的 这 种 性 能 度量 
方法 呢 ? 

争 9. 你 认为 对 于 两 个 不 同 的 SPEC CPU 基准 的 版 本 ， 即 SPEC 95 和 SPEC 2000， 应 该 比较 的 数值 是 什么 ? 

10. 除了 零售 商 部 门 以 外 ， 还 有 其 他 什么 部 门 需要 性 能 好 的 事务 处 理 系 统 。 证 明 你 的 结论 。 

令 11. 如 果 你 要 购买 一 台 计算 机 系统 打算 从 事 DNA 研究 ， 那 么 在 本 章 中 所 讨论 的 哪 一 个 基准 最 有 用 ? 为 什么 
会 选择 这 一 基准 ? 对 于 其 他 基准 ， 你 是 否 还 感 兴趣 ? 请 说 明 为 什么 感 兴趣 ， 或 者 为 什么 不 感 兴趣 ? 

12. 假设 一 位 朋友 让 你 帮助 做 出 选择 ， 作 为 在 家 个 人 使 用 应 该 购买 什么 类 型 的 计算 机 。 在 不 同 的 品牌 和 型 
号 比较 中 ， 你 要 寻找 的 是 什么 样 的 系统 性 能 ? 而 如 果 你 是 在 帮助 雇主 购买 一 台 Web 服务 器 来 从 事 在 网 
上 接受 客户 订单 的 工作 ， 那 么 在 这 种 情形 下 ， 你 的 想法 又 会 有 什么 不 同 ? 

令 13. 假设 你 恰好 被 分 配 到 某 个 委员 会 ， 委 派 你 购买 一 台新 的 企业 级 文件 服务 器 。 这 个 服务 器 能 够 支持 客户 
的 各 种 账目 活动 ， 同 时 还 要 有 许多 的 管理 功能 ， 例 如 可 以 生成 每 周 的 工资 表 。 委 员 会 的 一 位 同事 正好 
知道 某 个 特定 的 系统 在 SPEC CPU 2000 基准 的 竞赛 中 脱颖而出 。 现 在 ， 这 位 同事 坚持 要 委员 会 购买 一 
台 这 种 系统 的 计算 机 。 请 问 ， 你 对 这 个 事情 有 什么 反应 ? 

* 14. 我 们 曾经 讨论 过 调和 平均 值 在 用 于 评估 计算 机 性 能 时 所 受到 的 限制 。 一 些 批评 者 建议 SPEC 应 该 使 用 
调和 平均 值 来 代替 。 设 计 一 个 “工作 ”单元 ， 这 个 工作 单元 适合 用 来 重新 对 SPEC 基准 进行 规划 ， 使 
其 成 为 一 个 速率 度量 标准 。 请 使 用 来 自 SPEC 网 站 www. spec. org 的 一 些 结果 ， 来 测试 你 的 理论 。 

*15. SPEC 和 TPC 都 为 Web 服务 器 系统 发 布 了 基准 。 分 别 浏览 这 两 个 组 织 的 网 站 (www. spec. org 和 
www. tpc. org)， 努 力 找 出 已 经 在 两 个 网 站 都 公布 了 结果 的 相同 的 〈 或 者 是 可 以 进行 比较 的 ) 系统 。 并 
对 发 现 进行 讨论 。 

16. 我 们 曾经 提 到 过 ， 在 系统 探测 跟踪 的 过 程 中 会 搜集 到 大 量 的 数据 。 为 了 给 你 一 个 有 关 这 些 数据 的 实际 
数量 的 一 些 概念 ， 假 设 现在 计划 安装 了 一 个 硬件 探测 器 来 记录 系统 的 程序 计数 器 、 指 令 寄 存 器 、 累 加 
器 、 内 存 地 址 寄存 器 ， 以 及 存储 器 缓冲 寄存 器 的 内 容 。 系 统 有 一 个 在 1GHz 频率 运行 的 时 钟 。 在 系统 
时 钟 的 每 个 时 钟 周期 内 ，5 个 寄存 器 的 内 容 都 会 被 写 人 探测 器 电路 附属 的 非 易 失 性 存储 器 中 。 假 设 每 个 
寄存 器 都 是 64 位 宽 ， 如 果 要 搜集 2 秒 时 间 的 数据 ， 那 么 探测 器 需要 配备 多 大 的 存储 器 ? 

17. 在 第 10. 5. 2 节 中 的 补充 内 容 中 介绍 了 一 些 提升 程序 性 能 的 技巧 方法 。 其 中 每 个 小 技巧 都 涉及 到 一 个 计 
算 机 组 成 原理 或 者 是 体系 结构 的 问题 。 如 果真 是 这 样 ， 请 给 出 这 些 技巧 建议 背后 的 理由 。 如 果 你 认为 
这 些 补充 内 容 中 缺少 了 什么 ， 请 在 分 析 过 程 中 加 入 你 自己 的 建议 。 
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. 在 我 们 讨论 磁盘 人 性 能 的 物理 特性 时 ， 曾 经 指出 用 10000 RPM 的 磁盘 替代 7200 RPM 的 磁盘 可 以 带 来 


10~50% 的 性 能 改善 。 为 什么 只 有 10%% 的 性 能 提升 呢 ? 是 否 有 可 能 根本 就 没有 改进 作用 ? 解释 原因 。 

对 于 下 面 给 出 的 一 系列 磁道 服务 请 求 ， 分 别 使 用 FCFS、SSTF、SCAN 和 LOOK 算法 ， 计 算出 磁头 辟 

遍历 的 磁道 数 。 当 第 一 个 请 求 到 达 磁 盘 请 求 队列 时 ， 读 / 写 头 正 位 于 第 50 号 磁道 处 ， 并 且 是 向 外 层 

(编号 较 低 的 ) 磁道 方向 移动 (提示 : 计算 磁头 辟 所 经 过 的 磁道 数 的 总 和 ， 而 不 管 这 个 磁道 是 否 会 被 读 

取 )。 

54, 36, 21, 74, 46, 35, 26,，67 

使 用 如 下 的 磁道 请 求 顺序 ， 计 算 第 19 题 的 问题 : 

82, 97, 35, 75, 53, 47, 17, 11 

在 某 个 特定 品牌 的 磁盘 驱动 器 上 ， 磁 头 辟 不 停顿 地 经 过 一 个 单一 磁道 所 花费 的 时 间 为 500 纳 秒 。 然 而 ， 

一 旦 磁头 到 达 一 个 有 服务 请 求 的 磁道 时 ， 则 需要 停留 在 目标 磁道 上 方 有 2 毫秒 的 “安置 (settle)” 时 

间 ， 然 后 才 开 始 数据 的 读 写 操作 。 基 于 上 面 这 些 时 间 规 定 ， 分 别 比 较 使 用 FCFS、SSTF 和 LOOK 算法 

执行 如 下 的 调度 时 所 需要 的 相对 时 间 。 这 里 ， 需 要 比较 SSTF 对 FCFS，LOOK 对 FCFS， 以 及 LOOK 

对 SSTF 的 时 间 。 就 像 在 前 面 的 问题 中 一 样 ， 当 第 一 个 请 求 到 达 磁 盘 请 求 队列 中 时 ， 读 / 写 头 在 第 50 号 

磁道 的 地 方 ， 并 且 正 在 向 外 层 〈 编 号 较 低 的 ) 磁道 方向 移动 。 请 求 磁道 如 下 ， 

35, 53, 90，67, 79,，37, ?76, 47 

使 用 如 下 磁道 请 求 顾 序 重 做 练习 题 21 假定 读 写 头 位 于 第 50 号 磁道 处 ， 正 在 向 外 移动 ) : 

48, 14, 85, 35, 84, 61, 30, 22 

在 讨论 SSTF 磁盘 调度 算法 时 ， 我 们 曾经 指出 饥饿 问题 “是 低 磁 盘 利 用 率 的 最 差 的 情况 ”。 解 释 为 什么 

会 是 这 样 。 

某 个 特定 的 微 处 理 器 完成 各 种 不 同 的 操作 可 能 需要 2、3、4、8 或 12 个 机 器 周期 数 。 其 中 ，25% 的 指 

令 需 要 2 个 机 器 周期 ，20% 的 指令 需要 3 个 机 唤 周 期 ，17.5% 的 指令 需要 4 个 机 器 周期 ，12. 5% 的 指 

令 需 要 8 个 机 器 周期 还 有 25% 的 指令 需要 12 个 机 器 周期 。 

全 a) 这 个 微 处 理 器 的 每 条 指令 的 平均 机 器 周期 数 是 多 少 ? 

令 b) 如 果 微 处 理 器 为 一 个 “1MIPS” 的 处 理 器 ， 那 么 要 求 时 钟 频率 〈 每 秒 机 器 周期 数 ) 是 多 少 ? 

仿 c) 假设 这 个 系统 需要 额外 的 20 个 时 钟 周期 从 存储 器 中 取 回 一 个 操作 数 。 其 中 40% 的 时 间 必 须 用 来 访 
问 存储 器 。 这 个 微 处 理 器 每 条 指令 的 平均 机 器 周期 数 又 会 是 多 少 ? 其 中 包括 了 微 处 理 器 的 存储 器 提 
取 指令 。 

菜 个 特定 的 微 处 理 器 完成 各 种 不 同 的 操作 可 能 需要 2、4、8、12 或 16 个 机 器 周期 。 其 中 ，17. 5% 的 指 

令 需要 2 个 机 器 周期 ，12. 5% 的 指令 需要 4 个 机 器 周期 ，35% 的 指令 需要 8 个 机 器 周期 ，20% 的 指令 

需要 12 个 机 器 周期 还 有 15% 的 指令 需要 16 个 机 器 周期 。 

a) 这 个 微 处 理 器 每 条 指令 的 平均 机 器 周期 数 是 多 少 ? 

b) 如 果 这 个 微 处 理 器 是 一 个 “1MIPS” 的 处 理 器 ， 那 么 要 求 时 钟 频率 (每 秒 机 器 周期 数 ) 是 多 少 ? 

c) 假设 这 个 系统 需要 额外 的 16 个 周期 来 执行 从 存储 器 中 取 回 一 个 操作 数 。 其 中 30% 的 时 间 必 须 用 来 
访问 存储 器 。 那 么 这 个 微 处 理 器 每 条 指令 的 平均 机 器 周期 数 又 是 多 少 ? 其 中 包括 微 处 理 器 的 存储 器 
提取 指令 。 


网 络 就 是 计算 机 。 
一 一 Sun 微 系 统 公 司 


第 11 章 “网 络 组 织 和 体系 结构 


11.1 概述 


Sun 微 系统 公司 在 20 世纪 80 年 代 发 起 了 一 场 大 规模 的 广告 活动 ， 其 宣传 口号 是 脸 灾 人 口 的 “网 
络 就 是 计算 机 ”。20 年 前 ， 这 句 话 确实 很 难 引起 人 们 的 注意 ， 但 是 它 就 像 旷野 中 的 呼唤 ， 向 人 们 预告 
着 今天 这 个 处 于 全 球 商 业 核心 的 万 维 网 的 到 来 。 如 今 ， 孤 立 的 商业 计算 机 已 经 变 得 过 时 和 无 用 了 。 

本 章 将 介绍 庞大 而 复杂 的 数据 通信 和 领域 ,其 中 重点 关注 因特网 。 我 们 将 会 从 历史 的 、 理 论 的 、 实 
践 的 观点 来 看 待 网 络 的 结构 模型 〈 网 络 协议 ) 。 理 解 了 网 络 运行 的 原理 之 后 ， 我 们 将 学 习 构 建 网 络 组 织 
的 各 种 设备 组 件 。 本 章 的 目的 是 给 读者 一 个 宽广 的 视野 ， 使 大 家 尽 可 能 了 解 每 个 计算 机 专业 人 员 在 职 
业 生 涯 中 可 能 会 遇 到 的 各 种 技术 和 术语 。 所 以 说 ， 要 理解 计算 机 同样 也 需要 理解 网 络 。 


11.2 早期 的 商业 计算 机 网 络 


当今 的 计算 机 网 络 沿 着 两 种 不 同 的 方向 发 展 。 一 种 致力 于 更 快 更 准确 的 商务 交易 ， 而 另 一 种 则 臻 
力 于 促进 学 术 和 科学 领域 中 的 协作 和 知识 共享 。 

各 种 数字 网 络 力求 以 最 简单 、 快 速 和 经 济 高 效 的 方式 共享 计算 机 资源 。 计 算 机 价格 越 贵 ， 众 多 用 
户 要 求 共享 资源 的 愿望 也 就 会 越 强 烈 。 在 20 世纪 50 年 代 ， 大 部 分 计算 机 的 价格 都 要 几 百 万 美元 ， 所 
以 只 有 财力 雄厚 的 公司 才 购买 得 起 多 台 计 算 机 系统 。 当 然 ， 在 偏远 地 区 工作 的 职员 与 在 总 部 工作 的 同 
事 一 样 需要 共享 计算 机 资源 ， 因 此 人 们 发 明 
了 一 些 将 他 们 的 计算 机 与 总 部 计算 机 连接 起 
来 的 方法 。 实 际 上 ， 几 乎 每 个 计算 机 制造 商 
在 当时 都 有 自己 独特 的 连接 方案 。 其 中 占 主 
导 优 势 的 是 IBM 公司 ， 它 拥有 自己 的 系统 
网 络 体 系 结 构 (system network architec- 
ture，SNA) 。 这 种 通信 体系 结构 ， 通 过 不 
断 完善 ,已 经 持续 使 用 了 30 多 年 。 

IBM 的 系统 网 络 体系 结构 (SNA) 是 一 
种 端 到 端 (end-to-end) 的 通信 规范 ， 利 用 这 
种 规范 ， 可 以 实现 物理 设备 〈 称 为 物理 单元 ， 
physical unit，PU) 之 间 的 逻辑 会 话 〈 称 为 逻 
辑 单元 ，logical unit，LU) 。 在 最 初 的 体系 结 
构 中 ,这 种 通信 系统 的 物理 部 件 由 终端 、 打 
印 机 、 通 信 控 制 器 、 多 路 复 用 器 和 前 端 处 理 
器 组 成 。 前 端 处 理 器 位 于 主机 系统 和 通信 线 
路 之 间 ， 它 负责 管理 所 有 的 通信 开销 ， 包 括 
轮 询 〈 轮 流 检测 ) 每 个 通信 控制 器 ， 而 这 些 
通信 控制 器 又 负责 轮 询 每 个 与 它们 连接 的 终 
端 。 这 种 体系 结构 如 图 11-1 所 示 。 图 11-1 一 种 分 层 的 轮 询 网 络 
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IBM 的 系统 网 络 体系 结构 是 设计 用 于 高 速 的 事务 处 理 和 客户 服务 查询 的 。 即 使 在 9600 b/s 位 / 
秒 ) 的 中 等 线路 速度 的 条 件 下 ， 如 果 所 有 网 络 设备 在 正常 的 负载 下 都 正常 运行 ， 那 么 对 主机 十 的 数据 
访问 也 几乎 是 同时 进行 的 。 然 而 ， 这 种 体系 结构 的 速率 是 以 牺牲 系统 的 灵活 性 和 设备 之 间 的 协同 工作 
能 力 为 代价 的 。 管 理 和 维护 这 些 网 络 方面 需要 巨大 的 人 力 开 销 ， 而 且 在 与 其 他 制造 商 的 设备 和 网 络 的 
连接 方面 通常 需要 高 度 的 软件 和 硬件 工程 技巧 。 在 过 去 30 多 年 ，SNA 已 经 适应 了 千变万化 的 商务 需 
求 和 网 络 环境 ， 但 是 这 些 基 本 的 概念 本 质 上 还 是 几 十 年 前 提出 来 的 。 事 实 上 ， 这 种 结构 设计 得 非常 好 ， 
SNA 的 各 方面 的 内 容 后 来 成 为 权威 的 国际 通信 体系 结构 OSI 的 基础 。OSI ( 即 开放 系统 互 连 ) 将 在 
11.4 节 中 讨论 。 虽 然 SNA 对 于 新 兴 的 数据 通信 科学 的 贡献 颇 多 ， 但 是 这 种 技术 多 年 来 几乎 只 是 按 常 
规 发 展 。 在 大 多 数 网 络 装置 中 ， 系 统 网 络 体系 结构 已 经 被 “开放 式 ” 因 特 网 协议 所 取代 。 


11.3 早期 的 学 术 和 科学 网 络 ; 因特网 的 起 源 和 体系 结构 


在 冷战 期 间 ， 大 多 数 研究 实验 室 的 美国 科学 家 都 在 政府 的 合同 下 辛苦 工作 ， 致 力 于 维护 美国 在 军 
事 上 的 领先 地 位 。 曾 经 一 度 在 技术 竞争 上 处 于 落后 地 位 时 ， 美 国政 府 成 立 了 一 个 称 为 高 级 研究 计划 署 
(Advanced Research Projects Agency，ARPA) 的 组 织 。 然 而 ， 当 时 这 个 组 织 完成 各 种 使 命 所 需要 的 各 
种 高 级 计算 机 ， 即 使 按照 五 角 大 楼 (美国 国防 部 ) 的 标准 ， 这 些 计算 机 也 是 非常 稀少 和 极其 昂贵 的 。 
不 久 ， 有 人 提议 建立 一 种 通信 和 链接， 将 分 散在 美国 各 地 的 少数 几 台 超级 型 计算 机 连接 起 来 ， 这 样 许多 
志趣 相投 的 研究 人 员 可 以 共享 计算 资源 。 而 且 ， 即 使 核 战 争 摧毁 了 网 络 中 的 大 量 节点 或 者 通信 线路 ， 
这 种 网 络 还 设计 有 足够 多 的 元 余 资 源 ， 可 以 维持 计算 机 之 间 的 不 间断 通信 。1968 年 12 月 未 ， 在 美国 
马萨诸塞 州 的 剑桥 ，BBN 咨询 公司 (Bolt、Beranek 和 Newman， 现 在 的 Genuity 公司 ) 拿 到 了 这 个 合 
同 ， 负 责 构建 该 网 络 。1969 年 12 月 ，4 个 节点 ， 即 犹他 大 学 、 加 利 福 尼 亚 大 学 洛杉矶 分 校 、 加 利 福 尼 
亚 大 学 圣 芭 芭 拉 分 校 和 斯 坦 福 (Stanford) 研究 所 ， 实 现 了 联机 运行 。 此 后 ，ARPA 网 络 不 断 扩大 ， 
包括 了 更 多 的 美国 政府 和 研究 机 构 。 后 来 ,美国 总 统 里根 将 ARPA 改名 为 DRAPA (Defense 
Advanced Research Projects Agency)，ARPAnet 就 变 了 DARPAnet。 在 20 世纪 80 年 代 早 期 ， 这 个 网 
络 的 节点 扩充 速率 大 约 是 每 月 增加 一 个 节点 多 一 点 。 然 而 ， 军 事 研 究 家 们 最 终 还 是 放 弈 了 DARPAnet， 
而 决定 采用 更 安全 的 通信 信道 。 

1985 年 ， 为 了 方便 进行 科学 和 学 术 研 究 ， 美 国 国 家 科学 基金 会 创立 了 自己 的 网 络 NSFnet。NSF- 
net 和 DARPAnet 有 着 相似 的 用 途 和 用 户 群 体 ， 然 而 ，NSFnet 在 性 能 上 要 优 于 DARPAnet。 结 果 , 在 
军 方 放弃 DARPAnet 时 ，NSFnet 吸收 了 DARPAnet， 而 且 NSFnet 发 展 成 为 了 今天 众所周知 的 因 特 
网 。 到 20 世纪 90 年 早期 ，NSF 已 经 派生 出 NSFnet， 于 是 NSF 就 开始 建造 一 个 更 快 、 更 可 靠 的 NSF- 
net。 后 来 ， 公 用 网 络 的 管理 事务 落 到 了 一 些 私 有 化 的 国家 和 地 区 性 的 企业 的 手中 ， 例 如 Sprint、MCI 
和 PacBell 等 。 这 些 公司 买 下 了 NSFnet 的 中 继 线 路 ， 称 为 主干 网 络 (或 高 速 链 路 ，backbones) ， 并 且 
通过 向 各 个 网 络 服务 提供 者 (ISP〉 出 售 主干 网 络 的 流量 来 笋 利 。 

最 初 的 DARPAnet 《和 现在 的 因特网 ) 可 以 从 核 战争 中 幸存 下 来 ， 原 因 是 DARPAnet 网 不 同 于 所 
有 20 世纪 70 年 代 构 建 的 其 他 网 络 ， 在 DARPAnet 中 ， 系 统 和 系统 之 间 没 有 专用 的 连接 线路 。 相 反 ， 
DARPAnet 只 要 有 可 以 利用 的 路 径 就 可 以 通过 路 由 发 送信 息 。 属 于 单一 对 话 的 数据 流 部 分 可 以 经 过 不 
同 的 路 径 到 达 目 的 地 。 这 里 的 关键 是 采用 一 种 自 带 地 址 信息 的 数据 报 (datagram， 一 种 自 带 寻 址 信息 
的 、 独 立地 从 发 送 端 行走 到 接收 端的 数据 包 ) 的 思想 ， 这 种 数据 报 是 以 数据 块 而 不 是 以 SNA 模型 所 使 
用 的 数据 流 的 形式 传送 数据 。 每 个 数据 报 都 包含 地 址 信息 ， 这 样 每 个 数据 报 都 可 以 作为 一 个 单一 的 、 
不 连续 的 单元 进行 路 由 。 

DARPAnet 的 第 二 个 革命 性 的 内 容 就 是 ， 对 于 不 同类 型 的 主机 之 间 通 过 不 同 速度 的 网 络 进行 的 通 
信 ， 创 立 了 一 种 统一 的 协议 。 因 为 它 连接 了 不 同 种 类 的 网 络 ， 所 以 DARPAnet 也 称 为 一 种 互连网 结 
(internetwork)。 根 据 最 初 的 规定 ， 每 个 计算 机 的 主机 需要 通过 一 个 接口 消息 处 理 器 (interface mes- 
sage processor，IMP) 的 方式 才能 够 连接 到 DARPAnet。IMP 负责 从 DARPAnet 的 语言 到 主机 系统 本 
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身 的 通信 语言 之 间 的 协议 转换 ， 因 此 在 IMP 和 主机 之 间 可 以 使 用 任意 的 通信 协议 。 现 在 ,路 由 器 (将 
在 11. 6.7 节 中 讨论 ) 已 经 替代 了 IMP， 并 且 现 在 的 通信 协议 也 远 没有 20 世纪 70 年 代 时 的 那么 多 种 类 
了 。 但 是 基本 原理 仍然 是 相同 的 ， 而 且 互 连 网 络 的 普通 概念 也 与 因特网 中 是 一 样 的 。 一 个 现代 互连网 
络 的 结构 如 图 11-2 所 示 。 图 中 说 明 的 是 4 个 路 由 器 构成 了 网 络 的 核心 。 这 些 路 由 器 连接 多 种 不 同类 型 
的 设备 ， 数 据 报 自己 决定 怎样 以 尽 可 能 最 有 效 的 方式 到 达 目 的 地 。 





打印 服务 器 


计算 机 主机 





， 路 由 器 


打印 机 


图 11-2 一 个 互连网 络 的 例子 

网 络 远 远 不 只 是 一 组 数据 通信 的 规范 。 也 许 它 是 一 种 哲学 。 哲 学 最 重要 的 思想 就 是 自由 和 信息 共 
享 的 开放 世界 ， 人 类 通过 人 和 思想 的 结合 决定 世界 的 命运 。 公 开 的 体现 是 一 种 风格 ， 而 这 种 风格 创建 
了 网 络 标准 。 在 因特网 架构 委员 会 (Internet Architecture Board，IAB) 的 支持 下 ， 通 过 一 个 民主 过 程 
形成 了 网 络 标准 。 因 特 网 架构 委员 会 是 在 非 盈利 网 际 协会 (Internet Society，ISOC) 的 监管 下 运作 的 。 
因特网 工程 任务 组 (Internet Engineering Task Force，IETF) 则 属于 因特网 架构 委员 会 ， 是 由 制定 详 
细 网 际 协 议 规范 的 工业 界 专家 组 成 的 一 个 松散 联盟 。IETF 以 RFC (Reduest of Comment， 请 求 评论 ) 
的 形式 发 布 各 种 标准 的 建议 ，RFC 对 任何 人 的 检查 和 评论 都 是 公开 的 。 现 在 ， 有 两 个 最 重要 的 RFC: 
RFC791 (网 际 协议 4) 和 RFC793 (传输 控制 协议 )， 它 们 形成 了 当今 全 球 网 络 的 基础 。 

ISOC 委 员 会 的 多 层 组 织 结构 可 能 带 有 官僚 机 构 的 混乱 管理 模式 ， 产 生 一 些 模棱两可 的 规范 。 但 
是 由 于 整个 过 程 的 公开 性 和 评论 家 们 的 天 资 ， 所 以 RFC 在 各 种 网 络 文献 中 属于 最 清楚 和 最 易 读 懂 的 
协议 文件 。 因 此 ， 不 足 为 奇 ， 网 络 设备 制造 商 很 快 就 适应 了 网 际 协 议 。 目 前 ， 网 际 协议 应 用 于 各 种 
网 络 : 包括 公众 网 络 和 专用 网 络 。 以 前 ， 网 络 标准 是 由 某 个 权力 委员 会 或 设备 供应 厂商 传 下 来 的 。 
这 种 方式 导致 了 ISO/OSI 《国际 标准 化 组 织 /开放 系 统 互连网 ) 协议 模型 的 形成 ， 这 些 内 容 将 在 下 面 
讨论 。 
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11.4 网 络 协 议 1: ISO/OSI 协议 


在 第 7 章 中 ,我 们 曾 介绍 了 各 种 数据 存储 器 接口 是 如 何 使 用 协议 〈 堆 ) 栈 的 。SCSI - 3 体系 结构 
模型 就 是 其 中 之 一 。 一 般 来 说 ， 协 议 堆栈 使 得 各 种 类 型 的 接口 具有 可 移植 性 、 可 维护 性 且 非 常 容易 
描述 。 其 中 最 重要 和 最 全 面 的 是 ISO/OSI (国际 标准 化 组 织 /开放 系统 互 连 ) 协议 堆栈 ， 它 是 许多 存 
储 器 和 数据 通信 接口 和 协议 的 理论 模型 。 每 个 协议 在 实现 细节 上 各 有 不 同 , 但 是 总 体 思 想 是 一 致 的 : 
协议 接口 的 每 一 层 都 只 与 它 本 身 相 邻 的 协议 层 相连 接 。 不 允许 跳 过 某 个 协议 层 。 协 议会 话 发 生 在 运 
行 在 两 个 不 同 的 机 器 上 的 相同 协议 层 之 间 。 这 种 通信 发 生 的 确切 方式 在 ISO 国际 标准 中 有 明确 定 
义 。 

在 20 世纪 70 年 代 末 期 ， 几 乎 每 台 计算 机 制造 商都 设计 了 自己 的 专用 通信 协议 。 协 议 发 明 者 有 
时 会 对 这 些 协议 的 细节 保密 ， 目 的 是 为 了 确保 各 自 产品 的 市 场 优 势 。 通 常 ，A 厂商 制造 的 设备 是 不 
能 和 B 广 商 生 产 的 设备 进行 通信 的 ， 除 非 在 两 台 设 备 之 间 安 装 协议 转换 工具 〈 黑 盒子 ) 。 尽 管 这 样 ， 
黑 盒 子 还 有 可 能 不 像 所 预期 的 那样 起 作用 ， 因 为 通常 在 黑 盒 子 造 好 后 ， 某 个 公司 又 会 改变 某 个 协议 
参数 。 

两 个 权威 的 世界 性 的 标准 制定 组 织 意识 到 ， 这 种 通天 塔 (Tower of Babel) 式 的 通信 成 本 越 来 越 昂 
贵 ， 最 终 会 阻碍 信息 共享 的 发 展 。 在 20 世纪 70 年 代 末 80 年 代 初 ， 国 际 标准 化 组 织 〈ISO) 国际 组 织 
和 国际 电报 和 电话 顾问 委员 会 CCITT) 都 试图 独立 建立 一 个 国际 标准 的 通信 结构 。 在 ,1984 年 ， 这 两 
个 组 织 达 成 共识 ,创建 了 统一 的 模型 ， 就 是 现在 大 家 所 熟知 的 ISO 开放 系统 互 连 参 考 模型 (ISO Open 
System Interconnect Reference Model，ISO/OSI RM) 。 这 里 ， 开 放 系 统 意味 着 系统 的 连接 对 任何 一 个 
公司 来 说 都 不 是 私有 的 。ISO 的 文件 之 所 以 叫做 参考 模型 ， 是 因为 实际 上 没有 商业 系统 会 使 用 这 个 模 
型 中 所 规范 的 所 有 特性 。 但 是 ， 对 于 理解 如 何在 标准 模型 的 环境 下 把 真正 的 协议 和 网 络 设备 组 合 起 来 ， 
ISO/OSI 模型 非常 有 帮助 。 

OSI RM 包含 7 个 协议 层 ， 从 第 一 层 的 物理 介质 互 连 层 ， 一 直到 第 7 层 的 应 用 层 。 这 里 必须 强调 
的 是 ，OSI 模型 只 定义 了 这 7 个 协议 层 的 每 层 的 功能 和 各 层 之 间 的 接口 。 实 现 的 细节 不 属于 模型 部 分 。 
许多 不 同 的 标准 化 组 织 ， 包 括 美国 电气 和 电子 工程 师 协 会 (IEEE)、 欧 洲 计算 机 制造 商 协会 〈EC- 
MA) 、 国 际 电信 联盟 的 电信 标准 部 门 〈ITU-T) 和 ISO 本 身 ( 指 该 ISO 模型 以 外 的 组 织 ) 都 提供 这 些 
实现 过 程 的 细节 。 在 最 高 层次 的 实现 可 以 完全 由 用 户 定 义 。 


11.4.1 一 个 比喻 


在 着 手 研究 OSI 参考 模型 的 技术 之 前 ， 我 们 先 用 一 个 比喻 来 帮助 说 明 分 层 协议 的 工作 原理 。 假 设 
你 和 你 姐姐 打赌 输 了 ， 结 果 是 必须 花 一 整 天 的 时 间 来 陪 你 的 外 里 Billy。Billy 是 个 非常 淘气 的 小 孩 ， 一 
且 不 如 意 就 会 生气 。 今 天 ， 他 决定 要 到 街 上 Dumpy 餐馆 吃 烤 牛肉 三 明治 。 这 种 烤 牛 肉 三 明治 要 就 着 芥 
末 和 咸菜 一 起 食用 。 一 样 不 能 多 ， 一 样 也 不 能 少 。 

进 了 餐馆 ， 你 安排 Billy 坐 好 ， 并 从 柜台 附近 的 自动 取 号 机 拿 到 一 个 号 码 。 柜 台 后 有 一 位 收银 员 
在 接受 顾客 订单 ， 另 外 有 一 个 人 在 食物 加 工区 处 理 订单 。 餐 馆 里 到 处 都 是 等 着 吃 午餐 的 钒 饿 的 工人 们 。 
你 发 现今 天 的 服务 好 像 特别 慢 。Billy 开始 大 声 饿 了 ， 并 不 停 地 用 小 手 拍 桌子 。 

虽然 你 非常 想 尽快 拿 到 Billy 的 三 明治 ， 但 还 是 要 等 待 收银 员 叫 到 你 们 的 号 码 ， 你 必须 服从 某 种 协 
议 ， 抢 在 别人 前 面 是 不 可 能 的 。 事 实 上 ， 如 果 违 反 协议 的 话 ， 有 可 能 被 餐馆 拒绝 ， 反 而 会 使 事情 变 得 
更 糟 。 ' 

当 最 终 轮 到 你 来 到 了 柜台 前 时 《此 时 Billy 的 吵闹 声 正 很 大 ，;， 你 把 订单 交 给 收银 员 ， 并 为 自己 叫 
了 一 份 金枪鱼 三 明治 和 茵 片 。 收 银 员 去 为 你 取 饮 料 ， 并 告诉 食物 处 理 员 准 备 一 份 金枪鱼 三 明治 和 一 份 
带 芥 末 和 咸菜 的 烤 和 牛肉 三 明治 。 尽 管 厨 师 在 一 片 嘲 杂 中 能 够 清楚 地 听 到 Billy 大 声 距 唆 中 的 每 一 个 字 ， 
但 是 她 仍然 等 着 收银 员 告诉 她 准备 什么 食物 。 
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因此 ， 不 管 他 叫 得 多 么 大 声 ，Billy 都 不 能 跳 过 餐馆 协议 中 的 收银 员 这 一 层 。 在 准备 三 明治 之 前 ， 


食物 处 理 员 必 须知 道 订单 是 合法 有 效 的 ， 而 且 顾 客 愿意 付 钱 。 她 只 能 通过 收银 员 的 告知 才能 知道 这 些 


信息 。 

三 明治 做 好 后 ， 厨 师 把 它们 单独 放 在 餐馆 包装 袋 里 ， 并 标记 好 里 面 是 什么 食品 。 收 银 员 取 来 三 明 
治 ， 与 苗 片 和 两 缸 可 乐 一 起 放 人 一 个 褐色 袋子 。 她 告诉 你 应 该 付 6. 25 美元 ， 你 付 给 她 10 美元 ， 她 找 
回 你 4. 75 美元 。 由 于 她 找 钱 的 数目 发 生 了 错误 ， 所 以 你 就 得 站 在 柜台 前 面 直 到 她 找 回 的 零钱 正确 无 误 
后 ， 才 回 到 了 自己 的 桌子 。 

打开 三 明治 袋子 后 ，Billy 发 现 他 的 烤 牛肉 三 明治 变 成 腌 牛肉 三 明治 ， 于 是 开始 新 一 轮 的 吵 阑 。 这 
时 ， 你 除了 重新 取 一 个 号 码 等 着 叫 号 外 别 无 选择 。 

在 找 错 钱 时 你 拒绝 离开 柜台 可 以 看 作 是 协议 各 层 之 间 发 生 的 错误 校 验 。 直 到 接收 层 从 发 送 层 接收 
到 满意 的 信息 时 ， 传 输 过 程 才 会 继续 进行 。 

三 明治 连同 它们 的 包装 相当 于 OSI 协议 数据 单元 (Protocol Data Unit，PDU) 。 一 旦 数据 被 上 层 协 
议 封装 起 来 ， 那 么 下 层 协 议 就 不 会 对 它 的 内 容 进行 检查 。 无 论 你 还 是 收银 员 都 不 会 打开 三 明治 的 包装 。 
而 且 当 收银 员 将 你 订 的 其 他 物品 一 起 放 进 那个 褐色 的 袋 中 时 ， 她 也 是 做 好 了 另 一 个 PDU。 因 为 你 订 的 
食品 都 在 袋子 中 ， 所 以 你 可 以 轻松 地 拿 到 自己 的 桌子 上 。 

在 Dumpy 餐馆 ， 你 知道 如 果 想 吃 什么 东西 的 话 ， 不 能 直接 去 找 厨 师 ， 也 不 能 去 找 另外 的 一 位 顾 
客 ， 或 者 是 去 找 维修 工 。 要 享受 午餐 服务 ， 只 能 在 取 号 后 去 找 收银 员 。 从 取 号 机 上 拿 取 的 号 码 可 以 类 
似 于 一 个 OSI 的 服务 访问 点 (Service Access Point，SAP) 。 只 有 当 出 示 号 码 证 明 你 是 排队 中 的 下 一 位 
时 ， 收 银 员 才 会 允许 你 下 订单 。 


11.4.2 OSI 参考 模型 


OSI 参考 模型 如 图 11-3 所 示 。 从 图 中 可 以 看 出 ， 协 议 共 由 7 层 组 成 。 相 邻 层 之 间 的 接口 通过 服务 
访问 点 接 人 ， 当 协议 数据 单元 经 过 协议 堆栈 时 ， 每 层 协议 增加 或 者 移 走 它 自 己 的 头 部 。 在 发 送 端的 末 
尾 增加 头 部 ， 在 接收 端的 末尾 移 走 头 部 。PDU 的 内 容 在 对 话 每 一 边 的 对 等 层 之 间 创 建 一 个 会 话 ; 这 个 
会 话 就 是 它们 的 协议 。 

上 面 已 经 用 一 个 比喻 解释 了 PDU 和 OSI 的 思想 ， 下 面 我 们 再 给 出 另 一 个 比喻 进一步 解释 OSI 的 
参考 模型 。 在 这 个 比喻 中 ， 假 设 我 们 自己 管理 自己 的 超级 菜 汤 和 美味 茶点 生意 ， 产 品 是 一 些 精 美的 菜 
汤 和 茶点 ， 销 售 给 整个 北美 地 区 具有 独特 品味 的 人 士 。 为 了 将 这 些 美 味 食品 送 到 客户 手中 ， 你 雇用 了 
名 叫 Ginger，Lee 和 Pronto (或 称 GL&P) 的 私人 运输 公司 。 制造 商品 的 系统 和 老 顾客 们 的 最 终 消费 
需要 经 过 一 系列 的 程序 过 程 ， 这 些 过 程 非常 类 似 于 OSI 参考 模型 的 那些 层次 所 执行 的 过 程 。 我 们 将 在 
下 面 的 章节 中 具体 介绍 。 

OS 物理 层 

许多 不 同 种 类 的 介质 都 可 以 在 通信 的 源 端 (启动 器 和 目标 端 (应 答 器 ， 之 间 传 输 比 特 数据 。 启 
动 器 和 应 答 器 都 不 需要 考虑 它们 之 间 的 会 话 是 在 铀 导线、 卫星 链 路 还 是 在 光缆 上 发 生 。OSI 模型 的 物 
理 层 负责 完成 传输 信号 的 工作 。 物 理 层 会 从 上 层 数据 链 路 层 接收 到 二 进 制 的 数据 流 ， 并 对 这 些 数据 进 
行 编 码 ， 然 后 根据 大 家 所 达成 的 协议 和 信号 标准 把 这 些 数据 放 到 通信 介质 上 进行 传输 。 

OSI 物理 层 的 功能 可 以 比 作 负 责 将 产品 送 往 顾客 的 GL&P 运输 公司 的 车 辆 。 当 你 将 包 圳 放 到 运输 
公司 后 ， 通 常 不 会 在 乎 包 庄 是 通过 火车 、 卡 车 、 飞 机 还 是 轮船 运送 到 目的 地 ， 你 所 关心 的 是 只 要 包 囊 
能 够 在 合理 的 时 间 内 完整 地 到 达 目 的 地 。 途 中 包 囊 处理 人 员 通 常 也 并 不 关心 包 右 中 的 内 容 ， 而 他 们 只 
是 关心 盒子 上 面 的 地 址 《有 时 ， 他 们 甚至 都 没有 注意 到 盒子 上 的 易 碎 物品 的 提示 fragile) 。 与 货物 
公司 运送 盒子 类 似 ，OSI 物理 层 运 送 的 是 传输 数据 帧 ， 有 时 我 们 将 这 些 数 据 帧 称 为 物理 协议 数据 单元 
(physical protocol data unites) ， 或 者 简称 为 物理 PDU。 每 个 物理 协议 数据 单元 都 携带 一 个 地 址 和 带 有 
包围 PDU 的 有 效 和 负载 《payload， 或 内 容 ) 的 分 界 符 的 信和 号 模式 。 
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113 OSI 参考 模型 : 接口 垂直 操作 ， 协 议 水 平 操作 





当 送 递 包 囊 时 ， 将 物品 放 到 一 个 合适 的 箱子 里 ， 写 上 送 货 地 址 的 行为 就 相当 于 OSI 数据 链 路 层 的 
功能 。 数据 链 路 层 负责 将 信息 数据 字 节 组 织 成 一 些 大 小 适合 于 沿 着 物理 介质 传输 的 数据 帧 。 如 果 你 准 
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备 运送 50 公斤 的 菜 汤 和 茶点 ， 而 GL&P 公司 规定 一 个 包装 的 重量 不 能 超过 40 公斤 ， 那 么 你 需要 至 少 
两 个 单独 的 盒子 来 运送 物品 。 数 据 链 路 层 所 完成 的 就 是 同样 的 工作 。 发 送 端的 数据 链 路 层 会 与 接收 端 
的 数据 链 路 层 协 商 传输 帧 的 大 小 和 速率 。 

帧 传输 的 定时 称 为 流 控 制 〈flow control) 。 如 果 数 据 帧 的 发 送 速度 太 快 ， 接 收 方 的 缓冲 器 将 会 发 生 
洲 出 ， 导 致 数据 帧 的 丢失 。 如 果 数 据 帧 的 发 送 速 度 不 够 快 ， 接 收 器 就 会 超时 并 断 开 连接 。 在 这 两 种 情 
况 下 ， 如 果 接 收 方 不 能 在 规定 时 间 间 隔 内 确认 发 送 的 数据 包 ， 数 据 链 路 层 会 自动 监测 到 这 个 问题 。 术 
果 没 有 收 到 这 种 确认 信和 号， 发 送 方 就 会 重新 发 送 这 个 数据 包 。 





OSI 网 络 层 


假定 你 告诉 GL&P 公司 ， 送 递 这 些 包 襄 时 要 经 过 新 泽 西 州 (New Jersey) 的 Newark， 原 因 是 中 
转 站 纽约 市 (New York) 总 是 非常 拥挤 ， 使 得 包 囊 不 能 及 时 到 达 。 换 一 种 说 法 ， 如 果 你 告诉 送 货 人 运 
送 包 里 所 走 的 路 径 ， 那么 你 就 在 履行 OSI 模型 的 网 络 层 所 要 完成 的 相同 功能 。 然 而 ， 在 费城 终点 站 的 
包 囊 处 理 员 如 果 知 道 了 纽约 市 的 塞车 情况 后 ， 便 决定 通过 Newark 运送 包 庄 ， 那 么 他 们 也 是 在 执行 网 
络 层 的 功能 。 这 种 类 型 的 局 部 决定 对 于 每 个 大 型 网 络 的 运行 都 是 至 关 重 要 的 。 大 部 分 网 络 结构 都 非常 
复杂 ， 要 每 个 终端 节点 计算 机 了 解 到 达 每 个 目标 节点 的 各 种 可 能 的 路 径 是 不 可 能 的 ， 内 此 网 络 层 的 功 
能 要 遍及 整个 系统 传播 。 

在 发 送 端 计算 机 中 ， 网 络 层 只 是 将 来 自传 输 层 的 地 址 信息 添加 到 协议 数据 单元 (PDU) 二 ， 然 后 
将 PDU 传送 到 数据 链 路 层 。 当 经 过 各 个 中 间 〈intermediate) 节点 传输 PDU 时 ， 网 络 层 是 在 执行 其 最 
重要 和 最 复杂 的 任务 ， 而 这 些 中 间 节 点 在 网 络 中 的 作用 就 像 货运 中 转 站 。 网 络 层 不 但 负责 建立 路 由 路 
径 ， 而 且 要 确保 PDU 的 大 小 与 所 有 位 于 发 送 端 和 接收 端 之 间 的 设备 兼容 。 
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现在 假设 包 囊 的 目的 地 是 加 拿 大 魁北克 〈Quebec) 的 一 个 食品 分 销 商店 。 在 包 详 到 达 后 ， 运 送 职 
员 会 打开 包 圳 以 证 实 商 品 在 传输 过 程 中 没有 损坏 。 她 会 打开 每 个 盒子 ， 检 查 一 下 是 否 有 压 扁 的 甸 头 和 
据 裂 的 茶叶 盒 。 她 并 不 关心 这 些 汤 是 否 太 咸 了 ,或 者 是 茶点 是 否 太 酸 了 。 她 所 关心 的 仅仅 是 到 达 后 的 
商品 的 完整 性 和 完好 性 。 一 旦 包裹 通过 了 检查 ， 这 个 职员 会 在 GL&P 公司 返回 给 你 的 收据 上 签字 ， 让 
你 知道 商品 已 经 安全 到 达 了 目的 地 。 

类 似 地 ，OSI 传输 层 为 协议 堆栈 中 它 上 面 的 各 个 层次 提供 质量 保证 功能 。OSI 传输 层 也 通过 它 和 
连接 的 另 一 端的 传输 层 之 间 的 握手 协议 ， 分 担 另 一 层 的 端 到 端 确认 和 错误 校正 任务 。 传 输 层 是 能 够 了 
解 网 络 或 协议 的 OSI 模型 的 最 低层 。 一 旦 传输 层 将 来 自 会 话 层 PDU 的 协议 信息 剥离 ， 会 话 层 就 可 以 安 
全 地 认为 在 PDU 中 没有 发 生 网 络 错误 。 





ISO 的 会 话 层 负责 仲裁 两 个 通信 节点 之 间 的 对 话 ， 在 需要 时 开发 和 关闭 对 话 。 会 话 层 可 以 控制 对 
话 方 向 和 方式 。 这 种 通信 方式 可 以 是 半 双 工 (half-duplex， 每 次 只 能 沿 一 个 方向 进行 )， 也 可 以 是 全 双 
工 〈full-duplex， 同 时 双向 进行 )。 如 果 通 信 方 式 是 半 双 工 的 ， 会 话 层 会 决定 由 哪个 节点 来 控制 线路 。 
在 文件 传输 过 程 中 ， 会 话 层 还 提供 恢复 检查 点 。 如 果 在 接收 正常 的 情况 下 ， 在 各 个 检查 点 (check- 
point) 每 次 都 会 发 布 一 个 确认 信息 的 数据 包 ， 或 者 是 数据 块 。 如 果 在 一 个 大 型 文件 的 传输 过 程 中 发 生 
了 一 个 错误 ， 会 话 层 将 从 最 后 一 个 检查 点 重新 发 送 所 有 的 数据 。 如 果 没 有 检查 点 的 处 理 过 程 ， 则 需要 
重新 发 送 整个 文件 。 

如 果 运 送 职员 注意 到 包 衷 在 传输 过 程 中 受到 损坏 ， 她 将 会 通知 〈 以 及 GL&P 公司 ) 物品 没有 完整 
地 到 达 目 的 地 ， 并 且 会 要 求 你 再 次 发 送 物品 。 如 果 损 坏 的 包 囊 是 50kg 中 10kg 的 那个 盒子 ， 那 么 你 只 
要 替换 10kg 的 盒子 里 的 物品 就 行 了 ， 另 外 40kg 的 商品 无 需 替 换 可 以 继续 送 到 顾客 手中 。 


ES 
) 六 元 


如 果 定 购 你 的 送 汤 和 茶点 的 顾客 居住 在 魁北克 的 法 诸 商 业 区 ， 而 装 汤 的 铅 头 盒 上 的 标签 是 用 英文 
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写 的 ， 那 你 该 怎么 办 呢 ? 当然， 你 想 把 汤 卖 给 那些 说 法 语 的 朋友 ， 所 以 希望 汤 铅 头 的 包装 上 有 双语 标 
签 。 假 如 魁北克 食品 分 销 商店 的 职员 为 你 完成 这 些 双语 标签 ， 那 么 他 们 所 做 的 工作 正 是 OSI 模型 中 表 
示 层 所 要 做 的 事情 。 

表示 层 为 它 上 面 的 应 用 层 提供 高 级 数据 解释 服务 。 例 如 ， 假 设 某 个 网 络 节点 是 一 台 IBM 公司 的 z 
系列 服务 器 ， 这 人 台 服 务 器 使 用 EBCDIC 代码 存储 和 传输 数据 。 主 机 服务 器 需要 向 一 台 刚刚 发 出 请 求 的 
基于 ASCII 代码 的 微型 计算 机 发 送 一 些 数 据 。 在 各 自 系 统 上 的 表示 层 会 决定 由 哪 台 机 器 执行 EBCDIC 
和 ASCII 之 间 的 代码 转换 。 这 两 台 机 器 都 可 以 同等 效率 地 进行 这 种 转换 工作 。 值 得 注意 的 是 : 主机 系 
统 是 向 它 自己 的 应 用 层 发 送 EBCDIC 代码 ， 而 客户 机 上 的 应 用 层 则 是 从 协议 堆栈 中 下 面 的 表示 层 中 接 
收 ASCII 代码 。 在 通信 会 话 期 间 ， 如 果 我 们 使 用 加 密码 或 者 进行 某 种 数据 压缩 ， 那么 表示 层 的 服务 同 
样 会 起 到 重要 的 作用 。 





OSI 的 应 用 层 负责 为 通信 的 一 端 用 户 ， 以 及 使 用 系统 资源 〈 程 序 和 数据 文件 ) 另 一 端的 接口 界面 
处 的 用 户 提 供 有 意义 的 信息 和 服务 。 应 用 层 还 提供 一 组 程序 ， 需 要 时 可 以 供用 户 调用 。 如 果 应 用 层 提 
供 的 应 用 程序 不 能 完成 这 项 工作 ， 那 么 用 户 可 以 自己 编写 程序 。 关 于 通信 方面 ， 这 些 应 用 程序 唯一 需 
要 做 的 是 向 表示 层 的 服务 访问 点 发 送 消息 ， 较 低 的 层次 会 负责 这 些 任 务 中 较 困 难 的 部 分 。 

为 了 享受 美味 的 超级 汤 料 ， 所 有 法 国 裔 的 加 拿 大 美食 家 们 只 需 打 开 包头 、 加 热 、 然 后 食用 。 因 为 
GL&P 公司 和 当地 的 食品 分 销 商 已 经 做 了 所 有 的 其 他 事情 ， 使 得 放 到 加 拿 大 的 餐桌 上 汤 鲜 美 可 口 就 像 
刚 从 自己 家 中 厨房 里 端 出 来 的 一 样 。 


11.5 网 络 协议 2: TCP/IP 网 络 结构 


当 OSI 和 CCITT 为 协议 堆栈 的 改进 争论 不 休 时 ，TCP/IP 迅速 传播 很 快 地 遍及 全 球 。 凭 借 它 在 学 
术 和 科学 通信 和 领域 的 声誉 ，TCP/IP 迅速 成 为 了 事实 上 的 全 球 数据 通信 标准 。 

尽管 TCP/IP 的 出 发 点 并 非 如 此 ， 但 是 它 现在 是 
一 个 大 家 所 偏爱 和 非常 有 效 的 协议 堆栈 。TCP/IP 有 ET HTTP. 
三 层 结构 ， 能 够 喘 射 到 OSI 模 型 的 7 层 结构 中 的 第 5 Telnet、SMTP 等 
层 上 面 。TCP/IP 的 三 层 协议 堆栈 如 图 11-4 所 示 。 因 
为 协议 中 的 IP 层 可 以 和 OSI 中 的 数据 链 路 层 和 物理 
层 松散 地 进行 耦合 ， 所 以 TCP/IP 能 够 适用 于 任何 类 
型 的 网 络 ， 甚 至 适用 于 单一 会 话 中 的 不 同 网 络 类 型 。 
它 唯一 的 要 求 是 所 有 参与 的 网 络 必 须 至 少 运行 版 本 4 
以 上 的 网 际 协议 (Internet Protocol，IPv4) 。 

自前 使 用 的 PP 协议 有 两 个 版 本 :IPv4 和 IPv6。 
IPv6 是 针对 IPv4 的 许多 限制 而 改进 的 。 尽 管 IPv6 有 许 。 图 11-4 TCP/IP 协议 堆栈 和 OSI 协议 堆栈 
多 优点 ， 但 是 由 于 大 量 的 机 器 安装 了 IPv4， 所 以 IPv4 仍 
然 可 以 应 用 许多 年 。IPv4 和 IPv6 之 间 的 一 些 主要 区 别 将 在 第 11. 5.5 节 中 讨论 。 这 里 ， 我 们 首先 详细 介绍 
IPv4。 


11. 5. 1 IPv4 网 际 协议 层 


TCP/IP 协议 堆栈 的 网 际 协议 〈IP) 层 ， 在 本 质 上 与 OSI 参考 模型 的 网 络 层 和 数据 链 路 层 的 功能 
相同 。 它 把 TCP 数据 包 分 成 数据 报 〈datagram) 协议 数据 单元 (PDU)， 然 后 再 加 上 把 数据 报 传送 到 
目的 地 需要 的 路 由 路 径 的 信息 。 数 据 报 的 概念 是 ARPAnet 网 络 发 展 的 基础 ， 现 在 ，ARPAnet 网 就 是 
因特网 。 数 据 报 可 以 在 没有 网 络 管理 员 的 干预 下 采用 任何 可 用 的 路 由 路 径 。 例 如 ， 参 见 如 图 11-5 所 示 

_ 的 网 络 。 如 果 中 间 节 点 义 拥 塞 或 者 失效 ， 则 中 间 节 点 Y 能 够 通过 节点 ZZ 路 由 数据 ， 直 到 节点 XX 恢复 可 
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以 全 速 支 持 路 由 。 路 由 器 是 网 络 中 最 关键 的 部 件 ， 研 究 专家 们 一 直 在 寻找 各 种 方法 来 提高 它们 的 效率 
和 人 性能。 在 第 11. 6. 7 节 中 ， 我 们 将 详细 介绍 路 由 器 。 





图 11-5 了 协议 中 数据 报 的 路 由 路 径 


组 成 TCP/IP 协议 数据 单元 包含 的 二 进 制 数据 字 节 称 为 8 位 字 节 (octets)， 这 是 因为 在 当时 设计 
ARPAnet 协议 时 ， 字 节 〈byte) 一 词 被 认为 是 IBM 主机 使 用 的 8 位 位 组 的 专用 术语 。 大 多 数 有 关 
TCP/IP 的 文献 中 都 使 用 8 位 字 节 〈octets) ， 但 是 为 了 清楚 起 见 ， 我 们 这 里 还 是 使 用 字 节 (byte)。 国 

















二 3 
5 3 
版 本 ,| 报头 | 。 服务 类 型 数据 报 子 总 长 度 
长 度 
包 标 识 分 段 偏 移 量 


p 选 项 (10 到 40 字 节 ) 和 8 填充 项 


鄞 







每 个 IPv4 的 数据 报 至 少 包含 40 个 字 节 ， 每 个 字 节 又 包含 一 个 24 字 节 的 报头 (又 称 为 标题 )， 如 
上 图 所 示 。 水 平行 表示 32 位 字 。 仔 细 观 察 上 图 会 发 现 ， 服 务 类 型 域 占用 了 从 第 8 位 开始 直到 第 15 位 
的 位 置 ， 而 标识 符 域 占据 了 报头 位 置 的 第 32 位 到 第 47 位 。 报 头 的 最 后 一 个 域 是 填充 域 ， 填 充 域 是 为 
了 确保 紧 跟 在 报头 后 面 的 数据 可 以 从 整 32 位 的 边界 开始 。 填 充 域 中 总 是 放置 一 些 数字 0。IPv4 报头 的 
其 他 部 分 〈 域 ) 分 别 为 : 
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* 版 本 〈Version) : 指示 正在 使 用 的 IP 协议 的 版 本 。 版 本 号 会 在 路 由 路 径 上 告诉 所 有 硬件 有 关 数 据 
报 长 度 和 报头 域 中 的 内 容 。 对 IPv4 来 说 ， 这 个 域 的 值 总 是 0100 (因为 0100s 一 4io) 。 

。 报 头 长 度 (Header Length): 用 32 位 字 的 方式 给 出 报头 的 长 度 。IP 报头 的 长 度 大 小 是 可 变 的 ， 
取决 于 IP 选项 域 的 值 ， 但 是 正确 的 报头 的 最 小 的 值 是 5。 

。 服务 类 型 (Type of Service); 控制 由 中 间 节 点 给 予 数 据 报 的 优先 级 别 。 数 值 的 范围 从 “常规 ” 
(routine) 000 到 “关键 ”(eritical) 101。 网 络 控 制 的 数据 报 用 110 和 111 来 指示 。 

“数据 报 总 长 (Total Length of Datagram); 给 出 整个 数据 报 长 度 的 字 节 数 。 从 上 面 的 布局 图 可 以 
看 出 ， 为 这 个 域 保 留 了 2 字 节 。 因 此 ，IP 数据 报 允 许 的 最 大 长 度 是 28 一 1， 即 65 535 字 节 。 

" 包 标 识 (Packet ID) : 为 网 络 上 的 每 个 数据 报 分 配 一 个 系列 号 。 这 种 主机 ID 和 包 ID 的 组 合 可 以 
唯一 识别 所 有 IP 数据 报 。 

“ 标志 (Flag) : 指定 数据 报 是 否 可 以 通过 中 间 节 点 进行 分 段 (fragment， 分 割 成 一 些 更 小 的 数据 
报 )。IP 网 络 必须 可 以 处 理 至 少 576 字 节 的 数据 报 。 大 部 分 网 络 可 以 处 理 长 度 大 约 为 8KB 的 数据 
包 。 例 如 ， 如 果 标 志 位 的 设置 为 “不 分 段 ”(Don't fragment)， 那 么 一 个 8KB 的 数据 报 就 不 能 通 
过 一 个 只 能 处 理 2KB 数据 包 的 网 络 上 路 由 传播 。 

。 分 段 偏 移 量 (Fragment Offset) : 指定 某 个 数据 报 中 的 分 段位 置 。 也 就 是 说 ， 分 段 偏 移 量 可 以 告 
诉 我 们 分 段 属 于 数据 报 的 哪 一 部 分 。 

“ 生存 时 间 (Time to Live，TTL): 生存 时 间 最 初 的 目的 是 用 来 测量 数据 报 可 以 保持 有 效 时 间 的 秒 
钟 数 。 数 据 报 在 一 个 路 由 循环 过 程 中 应 该 能 够 被 节点 捕捉。 在 数据 报 出 现 拥塞 问题 之 前 ，TTL 
(理论 上 ) 将 会 终止 。 实 际 上 ， 每 次 数据 报 经 过 一 个 中 间 网 络 节点 ，TTL 都 会 递减 。 央 此 ，TTL 
字段 并 不 能 真正 测量 数据 报 可 以 生存 的 秒 钟 数 。 但 是 ，TTL 可 以 计算 数据 报到 达 目 的 地 前 的 跳 
跃 数 (简称 跳 数 ，the number of hops) 。 

* 协议 编号 (Protocol Number) : 指示 哪个 高 级 协议 正在 发 送 跟 在 报头 后 面 的 数据 。 这 个 域 中 的 几 
个 重要 的 值 如 下 ， 

0 一 预 留 (Reserved) 

1 一 因特网 控制 消息 协议 (Internet Control Message Protocol，ICMP) 
6 一 传输 控制 协议 〈Transmission Control Protocol，TCP) 

17 一 用 户 数据 报 协 议 (User Datagram Protocol，UDP) 

在 11. 5. 3 节 中 将 详细 讨论 TCP。 

。 报 头 校 验 和 “(Header Checksum) : 这 个 字段 的 值 是 通过 首先 计算 报头 中 的 所 有 16 位 字 的 反 码 
(又 称 为 1 的 补 码 ，one's complement) 和 ， 然 后 取 求 和 结果 的 反 码 求 得 的 。 校 验 
字段 本 身 最 初 设置 均 为 0。 反 码 和 是 两 个 字 的 算术 和 ， 并 将 进位 (第 17 位 ) 加 
到 求 和 结果 的 最 低位 。 (读者 可 以 复习 2.4.2 节 的 内 容 )。 例如， 反 码 算术 
11110011 十 10011010 二 110001101 王 10001110。 报 头 校 验 和 的 意义 是 ， 如 果 我 们 
有 一 个 如 下 图 形式 的 IP 数据 报 ， 每 个 w; 在 IP 数据 报 中 是 一 个 16 位 字 。 那 么 完 
整 的 求 校 验 和 是 每 次 计算 两 个 16 位 字 : 四 十 me 一 SI S1 十 wi 二 Sz; …; Si 十 
zi 一 St+l。 

。 源 地 址 和 目的 地 址 (Source and destination addresses) : 表示 数据 报 要 到 达 的 目的 
地 址 。 在 第 11. 5. 2 节 中 将 会 对 这 个 32 位 字段 做 详细 介绍 。 

。]P 选项 (IP Options) : 提供 某 些 诊断 信息 和 路 由 控制 。IP 选项 是 可 选项 。 图 


11.5.2 |IPv4 过 到 的 困难 


在 IP 报头 中 为 每 个 字段 分 配 的 字 节 数目 反映 了 IP 设计 的 技术 时 代 。 如 果 回 到 ARPAnet 网 络 的 年 
代 ， 没 有 人 能 够 想像 网 络 会 如 何 发 展 ， 甚 至 也 没有 人 想像 网 络 可 以 应 用 于 普通 的 民用 。 
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由 于 当今 最 慢 的 网 络 也 要 比 20 世纪 60 年 代 最 快 的 网 络 快 ， 所 以 将 IP 数据 包 的 长 度 限 制 为 65536 
个 字 节 已 经 成 为 一 个 问题 。 对 于 某 些 网 络 设备 来 说 ， 现 在 的 数据 包 的 移动 速度 实在 是 太 快 了 ， 以 至 于 
无 法 保证 在 中 间 节 点 之 间 数 据 包 可 以 完整 无 损 。 如 果 以 千 兆 比特 〈GB) 的 速度 传输 ，65535 字 节 的 IP 
数据 报 通过 某 个 点 的 时 间 还 不 到 一 毫秒 。 

到 目前 为 止 ，IPv4 报头 所 遇 到 最 严重 的 问题 是 有 关 地 址 的 问题 。 每 台 主 机 和 路 由 器 在 整个 网 络 中 
必须 有 一 个 独一无二 的 地 址 。 为 了 确保 不 会 出 现 网 络 节点 的 重复 ， 主 机 ID 由 一 个 权威 机 构 来 管理 ， 也 
就 是 因特网 域名 和 编号 分 配 组 织 (Internet Corporation for Assigned Names and Numbers，ICANN, 或 
称 为 因特网 域名 管理 中 心 )。ICANN 负责 跟踪 记录 由 区 域 性 权威 机 构 分 配 或 指定 的 所 有 IP 地 址 。 
ICANN 还 要 协调 协议 中 使 用 的 各 种 参数 值 ， 以 便 使 每 个 人 都 了 解 各 个 参数 值 会 引起 什么 样 的 网 络 行 
为 。 

从 了 报头 的 分 配 工 具 条 可 以 看 出 ， 大 约 可 以 有 23? 或 43 亿 个 主机 标识 ID。 人 们 可 以 合理 地 认为 主 
机 的 地 址 数目 是 足够 多 的 ， 其 实 不 然 。 事 实 上 ， 问 题 在 于 这 些 地 址 并 不 能 像 序列 号 一 样 连续 地 分 配给 
下 一 个 想 要 地 址 的 人 。 实 际 上 情况 要 复杂 得 多 。 

IP 允许 有 三 种 类 型 的 网 络 ， 分 别 指定 为 A 类 、B 类 和 C 类 。 这 些 网 络 类 型 通过 每 种 类 型 直接 支持 
的 节点 〈 称 为 主机 ，host) 的 数目 的 不 同 来 区 分 。A 类 网 络 能 够 支持 的 主机 数目 最 多 ，C 类 则 最 少 。 

IP 地 址 中 的 前 三 位 表示 网 络 的 类 型 。A 类 网 络 地址 总 是 是 从 0 开始 ，B 类 网 络 是 从 10 开始 ， 而 C 
类 网 络 则 是 从 110 开始 的 。 地 址 中 剩余 的 位 用 作为 网 络 编号 和 在 该 网 络 编号 中 的 主机 标识 ID， 如 图 
11-6 所 示 。 





主机 (24 位) A 类 网 络 


网 络 (14 位 ) 主机 (16 位) B 类 网 络 
> 主机 
110 网 络 21 位) C 类 网 络 


图 11-6 IP 地 址 分 类 


IP 地 址 为 32 位 二 进 制 数 ， 通 常用 带 点 的 十 进 制 表示 法 来 表示 ， 例 如 ，18.7.21.69， 或 者 
146. 186. 157. 6。 每 个 十 进 制 数 代表 8 位 的 二 进 制 信息 ， 因 此 它们 可 以 是 位 于 0 和 255 之 间 的 一 个 十 进 
制 数 值 。127. X. X.X 是 一 个 A 类 网 络 ， 但 是 保留 用 作 回 送 测试 〈loopback testing) ， 检 查 运 行 在 主机 
上 的 TCP/IP 协议 过 程 。 在 回 送 测试 过 程 中 没有 数据 报 进 和 网络 。0. 0. 0. 0 网 络 地 址 通常 预 留 给 网 络 中 
的 默认 路 由 使 用 。 

考虑 到 预 留 的 网 络 0 和 127， 实 际 上 只 可 以 使 用 7 位 网 络 字段 来 定义 126 个 A 类 网 络 。A 类 网 络 是 
所 有 网 络 中 最 大 的 ， 每 个 A 类 网 络 大 约 能 够 支撑 1. 67X 107 个 节点 。 尽 管 A 类 网 络 不 可 能 需要 所 有 的 
1. 6X10? 个 可 用 地 址 ， 但 是 从 1. 0. 0.0 到 126. 255. 255. 255 的 A 类 地 址 很 久 以 前 就 已 经 分 配给 了 像 MIT 
和 XEROX 公司 这 样 早期 网 络 使 用 者 。 而 且 ， 所 有 的 16382 个 B 类 网 络 ID (从 128.0.0.0 到 
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191. 255, 255. 255) 也 已 经 分 配 完 毕 。 每 个 了 B 类 网 络 可 以 包含 65534 个 唯一 的 节点 地 址 。 因 为 很 少 有 组 织 
需要 超过 100000 个 地 址 ， 所 以 人 们 的 下 一 个 选择 是 C 类 网 络 ， 每 个 C 类 网 络 只 有 256 个 地 址 ，C 类 网 络 
空间 的 地 址 分 配 是 从 192. 0. 0. 0 到 233. 255. 255. 255。 显 然 ， 这 甚至 远 远 不 能 够 满足 一 个 中 等 规模 的 公司 
或 者 研究 机 构 的 需求 。 因 此 ， 许 多 网 络 不 能 获得 连续 的 IP 地 址 块 ， 而 导致 网 络 中 的 每 个 节点 都 可 能 有 自 
已 的 地 址 。 于 是 ， 人 们 设计 了 许多 非常 精巧 的 工作 区 来 处 理 这 个 问题 ， 但 是 这 个 问题 的 最 终 解 决 办 法 是 
要 重新 设计 整个 IP 地 址 的 结构 。 在 第 11. 5. 6 节 中 ， 我 们 将 讨论 这 种 新 的 地 址 结构 。 还 有 D 类 网 络 和 下 
类 网 络 存在 ， 但 是 它们 根本 不 是 网 络 ， 而 只 是 一 些 预 留 地 址 组 。D 类 地 址 是 从 224 到 240， 是 由 一 些 共享 
某 个 相同 特性 的 主机 群 用 作 多 信道 广播 。E 类 地 址 是 从 241 到 248， 是 为 以 后 使 用 预 留 的 。 

除了 地 址 空间 最 终 会 被 耗 尽 外 ，IPv4 中 还 存在 其 他 一 些 问题 。 网 络 最 初 的 设计 者 并 没有 预料 到 网 
络 的 迅速 发 展 和 由 于 地 址 分 类 方案 而 导致 的 路 由 问题 。 通 常 ， 在 一 个 主干 网 络 的 路 由 器 的 路 由 表 
(routing table) 中 有 超过 70000 个 路 由 路 径 选 择 。 目 前 IPv4 的 路 由 的 基础 结构 需要 进行 修改 ， 以 减少 
路 由 器 必须 存储 路 由 路 径 的 数目 。 由 于 使 用 了 高 速 缓存 存储 器 ， 比 较 大 的 路 由 器 存储 器 会 造成 路 由 信 
息 的 检索 非常 慢 。 同 样 ， 在 IP 层次 上 也 必须 有 一 定 的 安全 保障 措施 。 目 前 ， 正 在 为 IP 层 定义 一 个 称 
为 IPSec (因特网 协议 安全 ，Internet Protocol Security) 的 协议 。 然 而 ， 这 个 协议 是 可 选 的 ， 目 前 尚未 
标准 化 和 广泛 采用 。 | 





源 端 口 际 


校 验 和 紧急 指针 





TCP 分 段 (也 称 为 报 文 段 〉 的 格式 如 上 图 所 示 。 图 的 上 方 显示 的 数字 是 每 个 域 所 覆盖 的 范围 。 水 
平行 代表 32 位 字 。 各 个 字段 〈 域 ) 的 定义 如 下 : 

。 源 端口 和 目标 端口 (Source and Desitination Ports) , 用 来 指示 运行 在 TCP 上 方 的 应 用 程序 的 接 

口 。TCP 通过 端口 号 来 分 辨 这 些 应 用 程序 。 

。 顺 序号 (Sequence Number) : 指出 有 效 载荷 中 数据 第 一 个 字 节 的 顺序 号 。TCP 会 给 每 个 传输 的 字 

节 分 配 一 个 顺序 号 。 如 果 有 100 个 数据 字 节 ， 每 次 发 送 10 个 字 节 ， 那 么 第 一 个 分 段 的 顺序 号 可 

能 是 0， 第 二 个 是 10， 第 三 个 是 20， 依 次 类 推 。 当 然 ， 这 个 起 始 的 顺序 号 可 以 不 必 是 0， 只 要 这 

个 数字 在 发 送 器 和 接收 器 之 间 是 唯一 的 。 

。 应 答 号 (Acknowledgement Number) : 包含 接收 器 所 期 望 的 下 一 个 数据 的 顺序 号 。TCP 使 用 这 个 

值 来 决定 在 传播 途中 是 否 丢 失 了 任何 数据 报 。 
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。 数 据 偏 移 量 (Data Offset) : 在 报头 中 所 包含 的 32 位 字 的 数目 ， 或 者 等 价 地 说 ， 是 在 分 段 中 数据 
开始 的 字 的 相对 位 置 。 也 称 作 报头 长 度 。 
“保留 〈Reserved) : 直到 有 人 对 这 6 位 提出 一 个 好 的 使 用 方案 ， 和 否则 这 6 位 一 定 要 设置 为 0。 
“标志 〈Flag) : 包含 用 于 大 多 数 协议 管理 的 6 位 字段 。 当 这 6 位 域 的 值 不 为 0 时 ， 就 将 它们 设置 为 
“ 真 〈true)”。TCP 的 各 种 标志 和 含义 如 下 : 
URG (紧急 比特 ) : 指示 这 个 分 段 中 存在 的 紧急 数据 。 紧 急 指针 字 跨 会 指示 跟随 在 紧急 信息 
之 后 的 第 一 个 字 节 的 位 置 。 
ACK (确认 比特 ); 指示 应 答 号 域 中 是 否 包含 重要 信息 。 
PSH (急迫 比特 ); 告诉 在 连接 中 的 所 有 TCP 程序 进程 要 清空 它们 的 缓冲 处 理 器 ， 即 将 数据 
“ 压 人 《push)” 接 收 器 中 。 当 有 效 载荷 中 存在 紧急 数据 时 ， 应 该 设置 这 个 标志 。 
RST (复位 比特 ) : 重启 一 个 连接 。 通 常 ， 它 会 强制 所 有 接收 到 的 包 进 行 有 效 性 验证 ， 并 且 把 
接收 器 置 回 到 “收听 更 多 数据 (listen for more data)” 的 状态 。 
SYN (同步 比特 ) : 指示 分 段 的 目的 是 为 了 同步 顺序 号 。 如 果 发 送 器 传输 [SYN，SEQ # = 
x ]， 则 接 下 来 它 应 该 从 接收 器 收 到 [ACK，SEQ # = x 十 1 ]。 在 两 个 节点 之 间 建 立 
一 个 连接 时 ， 它 们 双方 会 相互 交换 彼此 的 初始 顺序 号 。 
FIN (终止 比特 ): 这 是 一 个 “完成 〈finish)” 标 志 。 它 让 接收 器 知道 发 送 器 已 经 完成 了 传 
输 ， 开 始 关 闭 连接 过 程 。 
窗口 (Window); 允许 两 个 节点 通过 陈述 各 自在 任意 分 段 中 希望 接受 字 节 数 来 定义 它们 各 自 的 数 
据 窗口 的 大 小 。 例 如 ， 如 果 发 送 方 传输 的 字 节 数 是 从 0 到 1023， 而 接收 方 在 应 答 CACK# ) 域 
中 应 答 字 节 数 是 1024 且 窗 口 值 是 512， 则 发 送 方 应 该 发 送 数据 字 节 数 1024 到 1535 进行 回复 。 可 
能 会 发 生 接收 方 的 缓冲 器 被 填 满 的 情况 ， 这 时 接收 方 会 要 求 发 送 方 减 慢 发 送 速 率 ， 以 便 接收 方 
可 以 跟 得 上 传输 的 速率 。 值 得 注意 的 是 ， 如果 接收 方 的 应 用 层 运行 得 非常 慢 ， 例 如 每 次 只 能 从 组 
冲 器 拉 人 1 个 或 2 个 字 节 的 数据 ， 则 在 接收 器 中 运行 的 TCP 进程 应 该 等 待 ， 直 到 应 用 层 缓 冲 器 
空 ， 有 足够 的 空间 判断 是 否 要 发 送 另外 一 个 数据 分 段 。 如 果 接 收 方 发 送 的 窗口 的 大 小 是 0， 这 个 
结果 表示 需要 确认 应 答 号 所 指示 的 所 有 字 节 ， 并 且 停 止 进一步 的 数据 传输 ， 直 到 具有 一 个 非 0 窗 
后 大 小 的 相同 的 应 答 号 被 再 次 发 送 过 来 。 
。 校 验 和 《〈Checksum): 这 个 域 包含 了 求 在 TCP 分 段 中 的 各 个 字段 以 及 一 个 如 下 的 IP 伪 报 头 
(pseudoheader) 的 校 验 和 ， 数 据 填充 域 和 校 验 和 域 本 身 除外 、 


1 2 3 

0 7 5 3 1 
目标 IP 地 址 

| 


正如 前 面 对 IP 校 验 和 的 解释 一 样 ，TCP 的 校 验 和 是 求 TCP 报头 和 TCP 分 段 正文 中 的 所 有 16 位 
字 的 16 位 反 码 (1 的 补 码 ) 。 
。 紧 急 指 针 (Urgent Pointer) : 指向 紧 跟 在 紧急 数据 后 的 第 一 个 字 节 。 这 个 字段 〈 域 ) 只 有 当 设 置 
了 URG 标志 时 才 有 意义 。 . 
* 选项 (Option) : 在 其 他 各 种 事务 中 ， 选 项 主要 关注 窗口 大 小 的 协商 问题 和 是 否 使 用 选择 性 的 应 
答 (Selective acknowledgment，SACK) 。 如 果 在 传输 过 程 中 某 个 位 置 发 生 了 一 个 分 段 丢失 ， 那 
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么 SACK 人 允许 在 一 个 窗口 中 重新 传输 某 些 特殊 的 TCP 分 段 ， 而 不 是 要 求 重新 传输 整个 窗口 。 在 
讨论 了 TCP 流 的 控制 后 ， 读 者 将 会 对 这 个 概念 理解 得 很 清楚 。 围 


tS3 TOP 


IP 协议 的 唯一 目的 是 要 在 网 络 中 正确 地 路 由 传输 数据 报 。 我 们 可 以 将 IP 看 作 一 个 运送 包 圳 的 邮 
递 员 ， 这 个 邮递 员 并 不 关心 要 运送 的 包 庄 的 内 容 ， 或 包 庄 运送 的 顺序 。 传 输 控 制 协议 (Transmission 
Control Protocol，TCP) 是 IP 服务 的 使 用 过 程 (用户 )， 因 此 TCP 会 真正 关心 这 些 内 容 ， 以 及 许多 其 
他 事情 。 

在 两 个 TCP 进程 之 间 的 协议 连接 要 比 IP 层 中 的 协议 连接 更 加 复杂 。IP 只 是 基于 报头 信息 简单 地 
接受 或 拒绝 数据 报 ， 而 TCP 则 会 与 一 个 运行 在 某 个 远程 系统 上 的 TCP 进程 建立 一 个 会 话 ， 我 们 称 为 
建立 一 个 连接 (connection)。 一 个 TCP 连接 与 电话 通话 非常 相似 ， 它 有 自己 的 协议 “礼节 (etiquett)”。 
会 话 开始 时 ，TCP 会 开放 一 个 服务 访问 点 (SAP)，SAP 就 是 在 TCP 上 层 运 行 的 应 用 程序 。 在 TCP 
中 ，SAP 是 一 个 称 为 端口 (port) 的 数字 值 。 端 口号 、 主 机 ID 和 协议 指定 名 组 合 起 来 就 变 成 了 一 个 套 
接 字 (或 称 为 接 插 件 ，socket)。 套 接 字 对 于 运行 在 TCP 上 层 的 应 用 程序 来 说 ， 在 逻辑 上 相当 于 一 个 文 
件 名 (或 称 为 句柄 ，handle) 。 这 个 应 用 程序 不 是 通过 它 的 硬盘 文件 名 访问 各 种 数据 ， 而 是 通过 这 个 套 
接 字 来 使 用 TCP 读 取 数据 。 从 0 到 1023 的 端口 号 称 为 “专用 (well-known)” 端 口号 ， 因 为 这 些 端 口 
都 是 为 某 些 特殊 的 TCP 应 用 程序 所 预 留 的 。 例 如 ，TCP/IP 文件 传输 协议 (File Transmission Proto- 
col，FTP) 的 应 用 程序 使 用 端 日 号 20 和 21。 而 远程 终端 协议 (Telnet terminal Protocol) 则 使 用 端口 
号 23。 编 号 从 1024 到 65535 的 端口 号 为 用 户 自 定 义 的 执行 程序 所 用 。 

TCP 要 确保 它 提供 给 应 用 程序 的 数据 流 是 完整 的 ， 并且 具有 正确 的 顺序 和 没有 重复 的 数据 。TCP 
还 要 确保 它 所 发 送 的 各 个 分 段 (segment， 指 一 些 带 有 报头 的 数据 包 ) 不 能 太 快 ， 以 免 这 些 数据 报 淹没 
中 间 节 点 或 接收 器 。 这 样 ，TCP 可 以 对 网 络 传输 过 程 中 发 生 的 各 个 不 规则 事件 进行 补偿 校正 处 理 。 一 
个 TCP 分 段 的 报头 要 求 至 少 有 20 个 字 节 。 数 据 有 效 载荷 的 长 度 是 可 选 的。 一 个 报 文 段 包括 报头 的 长 
度 最 多 为 65515 字 节 ， 这 样 整个 报 文 段 就 可 以 适合 于 IP 的 有 效 载荷 。 如 果 需 要 或 者 某 个 中 间 节 点 请 求 
的 话 , IP 也 可 以 分 割 成 一 个 的 TCP 分 段 。 

TCP 提供 了 一 种 可 靠 的 、 面 向 连接 的 服务 。 面 向 连接 (connection-oriented) 就 是 在 主机 可 以 进行 
任何 信息 交换 (类似 于 电话 呼叫 ) 之 前 必须 先 建立 这 个 连接 。TCP 通过 分 配给 每 个 报 文 段 的 顺序 号 来 
保证 连接 的 可 靠 性 。TCP 同时 使 用 应 答 机 制 来 验证 所 收 到 的 分 段 内 容 ， 而 且 应 答 信号 必须 在 规定 的 时 
间 周 期 内 发 送 和 接收 。 如 果 没 有 应 答 信号 返回 ， 数据 就 要 重新 传输 。 在 下 一 节 中 ， 我 们 会 简单 地 介绍 
TCP 的 工作 原理 。 


11. 5.4 TCP 的 工作 原理 


我 们 如 何 才能 组 合 TCP 的 所 有 内 容 ， 在 独立 系统 上 运行 的 两 个 或 更 多 的 TCP 程序 进程 之 间 建立 
一 个 可 靠 有 序 和 没有 错误 的 连接 呢 ? 成 功 的 通信 需要 有 三 个 基本 过 程 : 第 一 是 启动 连接 ,第 二 是 交换 
数据 ， 第 三 是 关 断 连接 。 首 先 ， 启动 系统 (initiator， 这 里 将 它 称 作 A) 将 一 个 “开启 〈open)” 的 初 
始 基 元 信号 发 送 到 运行 在 远程 系统 B 上 的 TCP 进程 。 我 们 假定 B 正在 监听 “开启 ”请 求 。 这 种 “ 开 


启 ” 初 始 基 元 的 形式 如 下 : 
加 | 
i 


—————————— SYN=True,SEQ#j 一 


二 二 





如 果 B 已 经 准备 好 接收 来 自发 送 方 的 一 个 TCP 连接 ， 那 么 了 B 会 做 如 下 回答 : 
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SYN=True,SEQ#=t 
ACK=True,ACK#=j+1 








ACK=True,ACK#=1+1————> 








二 二 -了 


加 | 
a=5 


现在 ， A 和 B 已 经 相互 进行 了 应 答 并 对 起 始 的 顺序 号 进行 了 同步 。A 的 下 一 个 顺序 号 是 :十 2， 而 


B 的 下 一 个 顺序 号 是 7 十 2。 像 这 样 的 协议 交换 常常 称 为 三 次 
握手 〈three-way handshakes) 协议 。 大 多 数 网 络 文献 都 会 给 
出 这 种 交换 过 程 的 示意 图 ， 如 图 11-7 所 示 。 

在 A 和 B 之 间 的 连接 建立 起 来 后 ， 接 下 来 它们 会 开始 协 
商 窗口 大 小 并 为 已 经 建立 的 连接 设置 一 些 其 他 选项 。 窗 口 会 
告诉 发 送 方 在 两 次 应 答 之 间 发 送 多 少 字 节 的 数据 。 例 如 ， 假 
定 A 和 B 协商 窗口 的 大 小 为 500 字 节 和 一 个 数据 有 效 载荷 的 
大 小 为 100 字 节 ， 双 方 都 同意 不 使 用 选择 性 的 应 答 方式 〈 这 
一 点 将 在 后 面 讨论 )。 图 11-8 表示 了 TCP 如 何在 两 个 主机 之 
间 管理 数据 流 。 需 要 注意 的 是 ， 如 果菜 个 报 文 段 丢 失 会 发 生 
什么 情况 : 那 就 是 整个 窗口 需要 重新 传输 ， 即 使 后 续 传 送 的 
各 个 报 文 段 都 没有 错误 。 


A 发 送 从 字 节 0 开 
始 的 100 个 字 节 


窗口 调整 :A 可 以 发 
送 字 节 100 到 599， 
而 无 需 应 答 确认 


A 发 现 字 节 100 到 
199 没有 到 达 目 的 地 


窗口 调整 :A 可 以 发 送 
字 节 300 到 600, 而 无 
需 应 答 确 认 





A 


ob. STEROAT VS NR ER I 





由 B 接收 字 节 0 到 99 完 成 ， 
一 发送 应 答 信号 确认 


着 一 数据 报 损坏 或 路 由 错误 


图 11-8 某 个 报 文 段 委 失 时 的 TCP 数据 传输 过 程 
但 是 ， 如 果 某 个 应 答 信号 丢失 ， 那 么 接 下 来 的 应 答 可 以 避免 发 生 数据 的 重 传 过 程 ， 如 图 11-9 所 


356 第 11 章 
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示 。 当 然 ， 必 须 及 时 送出 应 答 信号 ， 以 防止 发 生 “ 超 时 (timeout)” 重 传 。 









A B 
A 发 送 从 字 节 0 开 
始 的 100 个 字 节 
le 一 一 B 接收 字 节 0 到 99 完 
加 成 ,发 送 应 答 信号 确认 
8 但 是 ACK,ACK#=100 
全 “损坏 或 路 由 错误 
传输 继续 而 不 管 丢失 的 
ACK 信号 ,窗口 调整 


变 为 从 字 节 200 到 699 


11-9 一 个 应 答 信号 丢失 
利用 应 答 号 ， 接 收 方 也 可 以 请 求 发 送 方 减 慢 或 终止 传输 。 特 别 是 当 接收 方 缓冲 器 变 得 太 满 时 ， 这 
样 做 是 非常 必要 的 。 这 种 方法 的 工作 原理 如 图 11-10a 所 示 。 图 11-10b 说 明了 当 B 不 能 接收 更 多 的 数据 
时 ，B 是 如 何 继续 保持 连接 畅通 的 。 


A B 
A 发 送 从 字 节 1000 开 
始 的 100 个 字 节 
一 B 告 诉 A 下 一 次 只 
发 送 50 个 字 节 
由 B 告诉 A 不 要 再 发 送 
字 节 , 请 暂停 一 会 儿 
a) B 通知 A 减 慢 发 送 速度 
A B 
如 果 2 分 钟 不 能 听 到 一 一 一 一 图 SEQ#=10s 
B 的 应 答 ,A 将 发 送 名 | 
一 个 字 节 | B 必须 给 A 发 送 一 个 


应 答 信 号 , 否则 A 会 
中 止 这 次 连接 





b) 当 不 能 接收 更 多 数据 时 ，B 需要 保持 连接 
11-10” TCP 流 控制 
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当 完 成 数据 交换 后 ， 一 个 或 两 个 TCP 的 程序 进程 将 会 终止 这 个 连接 。 连 接 的 其 中 一 方 ， 假设 A， 
可 以 通过 发 送 一 个 FIN 标志 设置 为 真 的 报 文 段 ， 来 向 连接 的 另 一 方 B 指示 数据 交换 任务 已 经 完成 。 这 
样 就 可 以 有 效 地 关闭 从 A 到 B 的 连接 。 但 是 ，B 会 继续 连接 它 的 会 话 端 ， 直 到 没有 数据 发 送 为 止 。 一 
且 B 完 成 数据 交换 ， 它 也 会 传送 设置 有 FIN 标志 的 报 文 段 。 如 果 A 应 答 B 的 FIN， 那 么 两 端的 连接 都 
会 被 终止 。 如 果 B 在 经 过 超时 还 没有 接收 到 应 答 信号 ，B 将 自动 终止 连接 。 

由 于 TCP 的 规则 并 不 十 分 严格 和 苛刻 ， 所 以 TCP 允许 发 送 方 和 接收 方 协商 一 个 超时 的 时 间 周 期 。 
对 于 速度 比较 慢 的 连接 ， 超 时 的 周期 应 该 设置 为 一 个 较 大 的 数值 。 发 送 方 和 接收 方 也 可 以 同意 使 用 选 
择 性 应 答 。 当 选择 性 应 答 〈SACK) 有 效 时 ， 接 收 方 必须 对 每 个 数据 报 都 做 出 应 答 。 换 名 话说， 就 是 
不 使 用 活动 窗口 。 当 有 错误 发 生 时 ，SACK 可 以 节省 一 些 带宽 ， 因 为 只 有 没有 应 答 确认 的 报 文 段 (而 
不 是 整个 窗口 ) 才 需 要 进行 重新 传送 。 但 是 ， 如 果 交 换 是 没有 错误 的 ， 那 么 因为 需要 发 送 应 答 报 文 段 
而 会 浪费 一 些 带宽 。 基 于 这 个 原因 ， 只 有 当 接 收 方 没有 太 多 的 TCP 缓冲 器 空间 时 ， 才 选择 使 用 
SACK。 接 收 方 缓冲 器 空间 越 大 ， 它 接收 无 序 报 文 段 的 “不 规则 空间 (wiggle room)” 就 会 越 多 。 总 
之 ，TCP 会 竭尽 其 能 为 运行 在 TCP 上 层 的 应 用 程序 提供 一 个 没有 错误 和 有 序 的 数据 流 。 


11.5.5 IPv6 


1994 年 ，IP 的 B 类 地 址 问题 在 发 展 过 程 中 似乎 出 现 了 重大 危机 ， 这 种 危机 使 得 网 络 的 爆炸 性 增长 
有 突然 中 断 的 潜在 可 能 性 。 由 于 有 接近 末路 的 紧迫 感 ， 网 络 工程 任务 组 (IETF)〉 开始 商议 IPv4 的 后 
继 产 品 ， 现 在 称 为 IPv6。 在 这 段 时 间 里 ，IETF 的 参与 者 发 布 了 许多 称 为 IPv5 的 实验 性 协议 。 这 些 协 
议 版 本 经 过 修正 和 改进 ， 成 为 现在 众所周知 的 IPv6。 专 家 预测 IPv6 要 到 21 世纪 前 10 年 的 后 期 才 会 广 
泛 实 行 。 每 天 都 会 有 许多 的 网 络 应 用 程序 要 进行 修改 以 适应 IPv6 的 要 求 。 事 实 上 ， 有 些 反 对 人 十 争论 
说 ，IPv6 永远 不 可 能 完全 配置 使 用 ， 因 为 使 用 IPv6 协议 需要 替换 许多 非常 昂贵 的 硬件 ， 而 且 因 为 已 经 
发 现 了 在 IPv4 中 国有 的 最 令 人 烦恼 的 工作 区 问题 。 但 是 ， 与 这 些 批评 者 观点 相反 ， 人 们 相信 IPv6 更 
有 办 法 解决 B 类 地 址 短缺 的 问题 。 事 实 上 ，IPv6 可 以 解决 大 多 数 人 还 没有 意识 到 的 许多 难以 处 理 的 事 
情 。 下 面 ， 我 们 会 对 这 些 问题 加 以 解释 。 

当然 ，IETF 设计 IPv4 后 继 者 的 主要 目的 是 拓展 IP 地 址 空间 ， 即 从 当前 的 32 位 地 址 扩展 为 源 主 
机 和 目标 主机 的 地 址 都 是 128 位 。 如 此 庞大 的 地 址 空间 简直 令 人 难以 置信 ,IPv6 可 以 产生 2128 个 可 能 
的 主机 地 址 。 具 体 地 说 ， 如 果 每 个 IP 地 址 分 配 一 个 重 28 克 〈1 体 司 ) 的 网 卡 ， 那 么 2128 个 网 卡 的 重量 
是 整个 地 球 的 1. 61X10!15 ( 千 万 亿 ，quadrillion) 倍 ! IPv6 可 以 提供 的 地 址 数量 几乎 是 无 穷 的 。 

如 此 大 的 地 址 空间 所 带 来 的 负面 影响 就 是 对 这 些 地 址 的 管理 变 成 了 非常 关键 的 因素 。 如 果 随 意 分 
配 这 些 地 址 而 没有 很 好 地 进行 组 织 安排 ， 那 么 要 进行 有 效 的 数据 包 路 由 传输 是 不 可 能 的 。 网 络 上 的 每 
个 路 由 器 都 要 求 有 超 型 计算 机 的 存储 容量 和 速度 以 应 对 随 之 而 来 的 路 由 表 数 目的 激增 。 为 了 避免 这 个 
问题 ，IETF 提出 一 个 分 层 地 址 的 组 织 结构 ， 并 称 之 为 全 球 统 一 地 址 格式 (Global Unicast Address 
Format)， 如 图 11-11a 所 示 。IPv6 地 址 的 前 三 位 构成 一 个 标志 ， 表 示 该 地 址 是 一 个 全 球 统一 地 址 。 接 
下 来 的 13 位 形成 所 谓 的 最 高 层 聚 集 标 识 码 (Top-level Aggregation Identifier，TLA ID)。 接 下 来 是 8 
位 预 留 位 ， 如 果 有 需要 ， 可 以 利用 这 8 个 保留 的 位 对 TLA ID 或 者 次 高 层 聚集 识别 码 (Next-level 
Aggregation Identifier，NLA ID) 进行 扩展 。 一 个 TLA 的 实体 可 能 是 一 个 国家 或 一 个 主要 的 全 球 性 的 
电信 公司 。 而 NLA 的 实体 则 可 能 是 大 公司 、 政 府 、 学 术 机 构 、 因 特 网 服务 提供 商 〈ISP) 或 者 是 小 规 
模 电信 公司 。 跟 在 NLA ID 后 面 的 16 位 是 站 点 聚集 标识 符 (Site-level Aggregation Identifier，SLA 
ID)。NLA 的 实体 可 以 使 用 这 个 字段 来 创建 自己 的 分 层 结 构 ， 人 允许 每 个 NLA 实体 有 65536 个 子 网 ， 每 
个 子 网 可 以 有 2% 个 主机。 这 种 分 层 结 构 的 示意 图 如 图 11-11b 所 示 。 

初 看 起 来 ， 为 每 个 子 网 预 留 2% 个 主机 的 观点 与 IPv4 的 网 络 类 型 系统 一 样 浪费 地 址 空间 。 但 是 ， 
这 样 大 的 地 址 空间 对 于 支持 跨国 地 址 自动 配置 (stateless address autoconfiguration) 是 完全 必要 的 ， 
跨国 地 址 自动 配置 是 IPv6 的 一 种 新 功能 。 在 无 状态 地 址 自动 分 配 中 ， 一 个 主机 会 使 用 固化 在 它 的 网 络 
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和 


a) 聚集 式 的 全 球 统一 地 址 格式 















b) 聚集 式 的 全 求 统一 地 址 的 分 层 结构 


图 11-11 聚集 式 的 全 球 统一 地 址 格式 和 分 层 结构 

接口 卡 中 的 48 位 地 址 ( 即 它 的 MAC 地址， 将 在 第 11. 6. 2 节 中 介绍 )， 以 及 从 该 主机 附近 的 路 由 器 获 
到 的 网 络 地 址 信息 一 起 形成 主机 的 完整 IP 地 址 。 如 果 在 这 个 过 程 中 没有 发 生 任何 其 他 问题 ， 那 么 网 络 
中 的 每 台 主 机 都 可 以 在 没有 网 络 管理 员 干涉 的 情况 下 自动 配置 自己 的 地 址 信息 。 这 种 特性 是 网 络 管理 
员 所 乐意 看 到 的 ， 特 别 是 当 一 个 实体 要 更 换 其 网 络 服务 提供 商 〈ISP) 或 者 通信 公司 时 。 这 里 ， 网 络 管 
理 员 只 需要 改变 路 由 器 的 IP 地 址 。 无 状态 地 址 自动 分 配 将 会 自动 更 新 网 络 中 每 个 节点 的 TLA 或 者 
SLA 的 字段 内 容 。 

IPv6 地 址 的 书写 语法 也 不 同 于 IPv4 地 址 的 书写 语法 。IPv4 地 址 使 用 小 数 点 十 进 制 计 数 法 表示 ， 
例如 146. 186. 157. 6。IPv6 地 址 使 用 十 六 进 制 表示 ， 用 冒号 隔 开 ， 例 如 : 


30FA:505A:B210:224C:1114:0327:0904:0225 

使 得 IPVA 更 容易 辨认 等 价 的 二 进 制 IP 地 址 。 

IPv6 地 址 可 以 缩写 ， 有 时 0 可 以 省 略 。 如 果 有 16 位 的 一 组 数字 是 0000， 则 可 以 写成 0， 或 者 0 全 
部 省 略 。 如 果 由 于 省 略 0 而 导致 有 两 个 以 上 的 连续 冒号 ， 那 么 这 些 连 续 的 冒号 可 以 缩减 为 两 个 冒号 。 
规定 在 地 址 格式 中 只 能 有 一 组 多 于 两 个 的 连续 的 冒号 。 例 如 ， 下 面 的 IPv6 地 址 : 


30FA:0000:0000:0000:0010:0002:0300 
可 以 简写 为 : 
30FA:0:0:0:10:;2:300 
或 进一步 简写 为 : 
30FA::10:2:300 
但 是 ， 类 似 30FA:: 24D6:: 12CB 这 样 的 地 址 是 无 效 的 。 
IETF 还 建议 两 种 其 他 的 路 由 方法 的 改进 : 实现 多 播 和 泛 播 。 多 播 〈 或 多 信道 广播 ，multicasting) 
是 指 在 网 络 的 某 处 放 上 一 条 消息 ， 然 后 由 多 个 节点 读 取 。 泛 播 (anycasting) 是 指 任何 一 个 逻辑 节点 群 


都 是 消息 的 接收 者 ， 数 据 包 并 没有 指定 某 个 特定 的 接收 器 。IPv6 的 这 一 特性 ， 以 及 跨国 地 址 自动 分 配 
特性 ， 非 常 利于 支持 移动 设备 。 移 动 设备 是 网 络 用 户 中 一 个 越 来 越 重要 的 部 分 ， 特 别 是 国际 之 间 的 通 
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信 大 多 数 都 是 使 用 无 线 网 络 。 

正如 前 面 所 说 ， 安 全 是 IPv6 区 别 于 IPv4 的 一 个 重要 的 领域 。 所 有 IPv4 的 安全 特性 〈IPSec) 都 是 
一 个 “可 选 (optional)” 项 ， 这 意味 着 没有 规定 必须 采取 任何 类 型 的 安全 措施 。 实 际 上 ， 大 多 数 的 安 
装 都 不 选 安全 项 。 在 IPv6 中 ，IPSec 是 强制 性 的 。IPv6 安全 改进 方法 是 一 种 防止 地 址 欺骗 〈address 
spoofing) 的 机 制 ， 所 谓 地 址 欺骗 是 指 一 台 主 机 可 以 与 使 用 伪造 的 IP 地 址 的 另 一 台 主 机 进行 通信 。 卫 
的 电子 欺骗 常常 被 用 来 破坏 路 由 器 和 用 来 阻止 外 来 人 侵 的 防火 墙 。IPSec 还 支持 使 用 加 密 和 其 他 措施 ， 
使 不 法 分 子 寻 找 没 有 授权 的 信息 变 得 更 加 困难 。 

也 许 IPv6 最 好 特点 是 提供 了 一 种 过 渡 方案 ， 可 以 让 网 络 逐 渐 转 向 新 的 格式 。 当 然 ， 支 持 IPv4 是 
IPv6 功能 的 一 个 组 成 部 分 。 使 用 这 两 种 协议 的 设备 被 称 作 双 栈 〈dual stack) 设备 ， 因 为 它们 同时 支持 
IPv4 协议 堆栈 和 IPv6 协议 堆栈 。 目 前 ， 市 场 上 有 许多 路 由 器 都 是 双 栈 设备 。 可 以 预期 ， 在 不 久 的 将 来 
使 用 IPv6 将 成 为 现实 。 

相对 于 IPv4 来 说 ，IPv6 的 优点 非常 明显 : 大 得 多 的 地 址 空间 ， 更 好 和 内 置 的 服务 质量 ， 以 及 更 好 
和 更 有 效 的 路 由 方案 。 所 以 ， 使 用 IPv6 ， 只 不 过 是 一 个 时 间 问 题 。 对 IPv6 的 商务 需求 和 一 些 必要 的 应 
用 程序 的 开发 将 会 促使 IPv4 向 IPv6 的 转变 。 虽 然 蔡 换 硬 件 的 开支 问题 是 这 种 转变 过 程 中 的 一 个 重大 
壁垒 ， 但 是 技术 人 员 的 培训 和 一 些 较 小 的 了 P 设备 〈 例 如 网 络 传真 机 和 打印 机 ) 的 替换 也 会 在 整个 转换 
的 开支 中 占 一 定 的 份额 。 随 着 网 络 汽车 〈IP-ready automobile) 和 许多 其 他 网 络 设备 的 出 现 ，IPv4 已 
经 不 再 能 够 满足 许多 当前 的 应 用 需求 了 。 加 





当然 ， 有 关 IPv4 最 明显 的 问题 是 32 位 地 址 域 。IPv6 通过 将 地 址 字段 扩充 到 128 位 来 改进 IPv4 地 址 受 
限制 的 这 个 缺点 。 为 了 使 IPv6 的 报头 尽 可 能 小 〈 可 以 加 快 路 由 速度 )， 极 少 使 用 的 IPv4 报头 字段 都 没有 包 
含 在 IPv6 主要 报头 中 。 如 果 需 要 这 些 字段 的 话 ，IPv6 还 提供 了 一 个 下 一 个 报头 (Next Header) 的 指针 。 通 
过 这 种 下 一 个 报头 区 域 ， 可 以 想像 IPv6 能 够 支持 大 量 的 报头 域 。 因 此 ， 未 来 对 人 P 功能 的 增强 所 带 来 的 破坏 
性 比 从 IPv4 到 IPv6 的 转变 所 预示 的 情况 要 小 得 多 。IPv6 的 报头 中 各 个 字段 解释 如 下 图 所 示 










re Rt 


目标 IP 地 址 
数据 
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。 版 本 (Version); 总 是 0110。 

。 传 输 类 别 (Traffic Class) : IPv6 最 终 能 够 说 出 实时 传输 (real-time transmission， 例 如 声音 和 视 
频 ) 和 时 间 敏 感性 较 低 的 数据 传输 通信 (less time-sensitive data transport traffic) 之 间 的 区 别 。 
这 个 字段 用 来 区 别 这 两 种 不 同 的 传输 类 型 。 

。 流 标签 〈Flow Label) ; 这 是 为 仍 在 改进 中 的 规范 准备 的 另外 一 个 字段 。 一 个 数据 “ 流 (flow)” 
就 是 一 个 会 话 ， 既 可 以 对 所 有 的 节点 广播 ， 又 可 以 只 在 两 个 特定 的 节点 之 间 启 动 。 流 标签 字段 
标识 出 一 个 特定 的 流 串 ， 以 及 中 间 路 由 器 需要 采用 与 这 个 流标 签字 段 中 的 代码 一 致 的 方式 来 路 
由 传送 数据 包 。 

。 有 效 载荷 长 度 (Payload Length) : 用 字 节 的 形式 指出 IPv6 的 有 效 载荷 的 长 度 ， 其 中 包括 附加 报 
头 的 大 小 。 

“下 一 个 报头 (Next Header): 如果 有 任何 跟 在 主 报头 的 后 面 其 他 报头 ， 这 个 字段 的 作用 是 指示 这 
些 报头 的 类 型 。 如 果 IPv6 的 协议 交换 需要 比 单一 报头 携带 更 多 的 信息 ， 那 么 这 个 下 一 个 报头 的 
字段 将 会 提供 一 个 扩展 的 报头 。 这 些 扩 展 报头 将 被 放置 在 IPv6 的 报 文 段 的 有 效 载荷 中 .如 果 没 
有 了 IP 扩展 报头 ， 那 么 这 个 字段 将 包含 “TCP” 的 值 ， 是 指 在 有 效 载荷 中 第 一 个 报头 的 数据 属于 
TCP， 而 不 是 属于 IP。 一 般 来 说 ， 只 有 目标 节点 会 检查 扩展 报头 的 内 容 。 而 中 间 节 点 会 把 它们 
看 作 像 普 通 的 有 效 载荷 的 数据 一 样 进行 传递 。 

。 跳 数 限制 (Hop Limit); 占 16 位 ， 这 个 字段 比 IPv4 大 得 多 ， 人 允许 有 256 个 跳 数 。 在 IPv4 版 本 
中 ， 每 个 中 间 节 点 的 路 由 器 会 对 这 个 字段 的 值 递减 。 如 果 这 个 值 变 为 0， 该 数据 包 将 会 被 委 弃 ， 
并 且 通 过 一 个 ICMP 信息 通知 发 送 方 (对 IPv6 而 言 )。 

。 源 地 址 和 目标 地 址 〈Source and Destination Address): 比 IPv4 中 的 源 地 址 和 目标 地 址 大 得 多 ,但 
是 含义 是 相同 的 。 读 者 可 以 回顾 一 下 有 关 地 址 格式 讨论 的 内 容 。 [J 


11.6 网 络 组 织 结构 


通常 ， 计 算 机 网 络 是 根据 网 络 的 地 理 服 务 范围 进行 分 类 的 。 最 小 的 网 络 是 局 域 网 (local area net- 
works，LAN)。 尽 管 局 域 网 可 以 包含 成 千 上 万 个 节点 ,但 是 它 通常 在 同一 栋 建 筑 物 使 用 ， 或 者 在 彼此 
非常 靠近 的 一 群 建筑 物 中 使 用 。 当 LAN 覆盖 两 个 或 两 个 以 上 的 建筑 物 时 ， 通 常 叫 做 校园 网 (campus 
network) 。LAN 所 覆盖 的 区 域 (财产 ) 通常 也 与 其 本 身 一 样 具 有 相同 的 所 有 权 (或 控制 权 )。 区 域 网 
(metropolitan area netwroks，MAN) 是 覆盖 一 个 城市 和 周边 地 区 的 网 络 。 区 域 网 通常 是 跨 地 区 的 ， 这 
些 地 区 的 所 有 权 并 不 属于 网 络 的 拥有 者 。 广 域 网 (wide area networks，WAN) 是 覆盖 多 个 城市 或 者 跨 
越 整个 世界 的 网 络 。 

曾经 有 一 段 时 间 ， 局 域 网 、 区 域 网 和 广域网 所 使 用 的 协议 彼此 之 间 互 不 相同 。 区 域 网 和 广域网 通 
常 被 设计 成 高 速 知 吐 量 ， 因 为 它们 要 用 作为 多 个 惕 速 局 域 网 的 主干 系统 ， 或 者 是 因为 它们 要 为 远 距离 
的 终端 用 户 提 供 访 问 大 型 计算 机 主机 的 数据 中 心 的 服务 。 然 而 ， 随 着 网 络 技术 的 发 展 ， 现 在 这 些 网 络 
在 速度 或 协议 方面 彼此 之 间 已 经 没有 了 太 大 的 区 别 ， 但 是 它们 的 所 有 权 还 是 不 同 的 。 某 个 人 的 校园 局 
域 网 可 能 是 另 一 个 人 的 区 域 网 。 事 实 上 ， 随 着 局 域 网 的 速度 越 来 越 快 ， 并且 更 易于 与 广域网 技术 集成 ， 
可 以 想像 区 域 网 的 概念 最 终 会 完全 消失 。 

本 节 将 讨论 局 域 网 、 区 域 网 和 广域网 通用 的 物理 网 络 设备 。 先 从 网 络 组 织 的 最 低层 ， 物 理 介 质 层 
(第 1 层 ) 开始 。 


11.6.1 物理 传输 介质 


实际 上 ， 任何 具有 传输 信和 号 能 力 的 介质 都 可 以 支持 数据 通信 。 有 两 种 通用 的 通信 介质 导向 
(guided) 传输 介质 和 非 导 向 unguided) 传输 介质 。 非 导向 传输 介质 是 利用 红外 线 、 徽 波 、 卫 星 或 无 
线 电 载 波 信号 等 透 过 广播 频率 进行 数据 传送 的 。 导 向 传输 介质 是 一 些 直接 连接 到 每 个 网 络 节点 的 物理 
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连接 器 ， 例 如 钢 线 或 光缆 。 

导向 传输 介质 的 物理 和 电气 特性 ， 决 定 了 介质 在 一 定 频率 下 可 以 准确 输送 信号 跨越 不 同 距 离 的 能 
力 。 在 第 7 章 中 ， 我 们 曾经 提 到 了 远 距 离 传输 时 信号 会 衰减 (减弱 ) 。 距 离 越 长 ， 信 号 的 频率 越 高 ， 这 
种 衰减 越 大 。 铜 线 中 信号 的 衰减 来 源 于 一 些 电 现象 的 相互 作用 。 其 中 主要 原因 是 铜 导 体 的 内 部 电阻 和 
当 信 号 传输 线路 相互 之 间 非 常 靠近 时 所 产生 的 电学 干扰 (电感 和 电容 )。 外 部 电场 ， 例 如 荧光 灯 和 电动 
马达 等 ， 也 能 够 使 铜 线 上 传输 的 信号 发 生 衰 碱 ， 其 至 失真 。 总 体 上 来 说 ， 阻 碍 信号 准确 传输 的 电 现 象 
称 为 噪声 〈noise) 。 信 号 和 噪声 的 强度 都 用 分 贝 (dB) 来 测量 。 电 缆 是 根据 有 噪声 存在 时 ， 不 同 频率 
下 传输 信号 的 质量 来 进行 评价 的 。 就 通信 信道 而 言 ， 这 种 评价 的 物理 量 是 信 骂 比 (signal-to-noise rat- 
ing)， 信 品 比 也 是 利用 分 贝 来 测量 的 : 


a 3 信号 〈dB) 
信 噪 比 〈dB) 一 10loglo 侣 声 dB) 


从 技术 上 来 说 ， 一 种 传输 介质 的 带宽 〈bandwidth) 是 传输 介质 能 够 传输 的 信号 频率 的 范围 ， 用 赫 
效 (Hz) 表示 。 传 输 介质 的 带宽 越 大 ， 能 够 传输 的 信息 越 多 。 在 数字 通信 中 ， 带 宽 是 传输 介质 的 信息 
传输 能 力 的 通称 ， 利 用 位 / 秒 〈b/s) 来 表示 。 数 字 通 信 中 的 另外 一 个 重要 度量 是 二 进 制 信号 的 误 码 率 
(bit error rate，BER)， 误 码 率 是 已 接收 到 的 出 错位 数 和 已 接收 到 的 二 进 制 信号 的 总 位 数 的 比值 。 如 果 
信号 的 频率 超过 了 线路 的 信号 传送 能 力 ， 误 码 率 (BER) 可 能 会 变 得 极为 严重 ， 以 致 于 连接 的 设备 在 
错误 校正 上 所 花费 的 时 间 比 正常 工作 时 间 还 要 多 。 
同 轴 电 线 
同 轴 电 费 曾 经 是 数据 通信 所 选择 的 传输 介质 。 它 传输 信号 的 频率 可 以 达到 T 赫兹 〈 每 秒 万 亿 次 )， 
而 且 信号 的 衰减 很 小 。 目 前 ， 同 轴 电 缆 主 要 应 用 于 广播 和 闭路 电视 中 。 同 轴 电 费 也 可 以 为 住宅 区 的 网 
络 服务 传输 信号 ， 这 种 服务 架构 于 有 限 电视 线路 。 

同 轴 电 缆 的 中 心 部 分 是 一 个 厚 〈12 一 16 gauge) 的 内 导体 ， 外 面 由 电介质 〈dielectric) 的 绝缘 层 所 包围 。 
绝缘 层 的 外 面包 围 着 一 层 锡 销 屏蔽 层 ， 目 的 是 防止 瞬 态 电磁 场 的 影响 。 锡 销 屏蔽 层 的 本 身 是 用 铜 丝 或 钢丝 编 
织 层 缠 绕 ， 可 以 作为 电缆 的 电学 接地 。 整 个 电缆 最 后 采用 耐久 性 的 塑料 层 封装 起 来 ， 如 图 11-12 所 示 。 





铜 导 体 






电介质 绝缘 层 
外 部 封套 铜 编织 网 锡 箱 屏 蔽 层 
图 11-12 同 轴 电 缆 的 局 部 


有 限 电视 服务 使 用 的 同 轴 电 缆 叫 做 宽带 (broadband) 同 轴 电 缆 ， 因 为 它 的 传输 能 力 至 少 是 2Mb/s。 
宽带 通信 使 用 多 路 复 用 技术 的 形式 提供 多 数据 信道 。 计 算 机 网 络 通常 使 用 窄带 (narrowband) 同 轴 电 
缆 ， 它 是 一 个 优化 的 单 信道 结构 ， 典 型 的 宽带 为 64Kb/s。 

双 绥 线 

两 台 计 算 机 之 间 最 简单 的 连接 方法 是 仅仅 采用 一 对 铜 导线 。 一 根 用 来 发 送 数据 ， 另 一 根 用 来 接收 
数据 。 当 然 ， 两 个 系统 之 间 的 距离 越 远 ， 信 号 需要 越 强 ， 这 样 可 以 防止 信和 号 在 长 距离 传送 过 程 中 衰减 
消失 。 同 样 ， 系 统 间 的 距离 也 会 影响 到 数据 传输 的 速度 。 系 统 相 距 越 远 ， 这 种 传输 线 的 速度 必须 越 慢 ， 
以 避免 发 生 过 多 错误 。 使 用 较 厚 的 导体 〈 较 小 的 电线 gauge 数 ) 能 够 减少 衰减 。 当 然 ， 较 厚 的 电线 要 
比较 薄 的 电线 更 贵 。 

除了 衰减 外 ， 电 缆 的 制造 商 还 需要 解决 电磁 感应 (inductance) 问题 。 当 两 根 导线 完全 平行 地 靠 放 
在 一 起 时 ， 电 线 中 较 强 的 高 频 信 号 会 在 铜 导体 周围 产生 (感应 ) 磁场 ， 这 种 感应 磁场 会 干扰 两 根 平行 
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电线 中 的 信号 传输 。 

减少 导体 之 间 电 感应 现象 的 最 简单 方法 是 把 两 根 电线 绞 拧 在 一 起 。 这 里 ， 每 直线 尺 所 用 的 绞 线 越 
多 , 线 与 线 之 间 彼此 干扰 所 产生 的 衰减 就 越 少 。 制 造 绞 线 要 比 制造 非 绞 线 要 贵 ,， 因 为 每 直线 尺 消耗 的 
电线 要 多 ， 并 且 还 要 仔细 控制 拧 绞 的 程度 。 双 绞 线 (twisted pair) 电缆 ， 指 其 中 有 两 对 绞 线 ， 应 用 于 
今天 的 大 部 分 局 域 网 的 连接 安装 (参见 图 11-3) 。 双 绞 线 有 两 种 类 型 : 屏蔽 双 绞 线 和 非 屏 蔽 双 绞 线 。 更 
常用 的 是 非 屏蔽 双 绞 线 。 





外 部 封套 电解 质 绝缘 层 
图 11-13 ” 双 绞 线 电缆 


屏蔽 双 绞 线 主要 适用 于 有 大 量 电 干扰 存在 的 环境 中 。 目 前 的 商业 环境 中 充满 了 各 种 可 以 干扰 网 络 
信号 的 电磁 辐射 源 。 这 些 电 磁 辐 射 源 有 的 看 起 来 和 荧光 灯 一 样 温和 ,但 有 的 像 喻 喻 叫 的 电源 变压器 一 
样 烦人 。 任 何 产生 磁场 的 设备 都 有 干扰 网 络 通 信和 链 路 的 潜在 可 能 性 。 干扰 信号 可 以 影响 网 络 的 传输 速 
度 ， 因 为 较 高 的 信号 频率 对 任何 种 类 的 信号 失真 都 会 非常 敏感 。 作 为 防止 环境 干扰 ( 称 之 为 电磁 干扰 
(electromagnetic interference，EMI) 或 射频 干扰 (radio-frequency interference，RFI)) 的 安全 措施 ， 
安装 使 用 屏蔽 双 绞 线 有 助 于 在 各 种 不 利 的 环境 中 保持 网 络 通信 的 完整 性 。 

因为 屏蔽 双 绞 线 的 材料 成 本 和 安装 费用 都 很 高 ， 所 以 一 些 专家 不 太 赞 成 使 用 屏蔽 双 绞 线 。 他 们 指 
出 ， 使 用 屏蔽 双 绞 线 时 如 果 接 地 不 当 ， 实 际 上 会 导致 出 现 更 多 的 问题 。 特 别 是 屏蔽 双 绞 线 可 以 作为 一 
个 天 线 ， 实 际 上 会 吸引 各 种 信号 趋向 导体 。 

无 论 是 屏蔽 双 绞 线 还 是 非 屏蔽 双 绞 线 ， 作 为 网 络 导体 都 必须 具有 适合 于 现在 所 使 用 的 网 络 技术 的 信 
号 输送 能 力 。1991 年 ， 电 子 工业 联合 会 EIA) 和 电信 工业 协会 (TIA) 联合 起 来 为 网 络 电缆 连接 建立 
了 一 个 评级 系统 。 评 级 系统 最 新 的 版 本 是 EIA/TIA 一 568B。EIA/TIA 分 类 (category) 评级 标准 规定 了 
在 信号 不 会 过 多 衰减 的 情况 下 ， 电 缆 传输 所 能 支持 的 最 大 频率 。ISO 的 评级 系统 ， 不 像 EIA/TIA 的 分 类 
系统 那样 经 常 使 用 ， 把 这 些 电 线 的 等 级 称 为 类 (class)， 如 表 11-1 所 示 。 目 前 ， 大 多 数 局 域 网 所 安装 的 
是 5 类 或 更 好 的 电缆 连接 。 许 多 网 络 安装 业已 完全 放弃 了 铜 导线 ， 而 采用 光缆 (参见 下 一 节 )。 


表 11-1 EIA/TIA 一 568B 和 ISO 电缆 规范 


Class D 100 MHz 
Class 下 250 MHz 


注意 ， 表 11-1 中 列 出 的 电缆 等 级 的 信号 传送 能 力 ,使 用 的 单位 为 兆赫 兹 《MHz)， 它 与 焰 位 
(Mb) 是 不 同 的 。 在 第 2.7 节 中 读者 看 到 ， 在 任意 给 定 的 频率 下 ， 传 送 的 位 数 与 网 络 中 所 使 用 的 编码 
方法 有 关 。 在 100Mb/s 以 下 运行 的 网 络 可 以 很 方便 和 经 济 地 使 用 曼彻斯特 编码 (Manchester coding) 
方法 ; 曼彻斯特 编码 对 于 每 传输 一 位 只 要 求 有 两 次 信号 转换 。 对 于 运行 在 100Mb/s 或 者 更 高 速率 的 网 
络 ， 则 使 用 不 同 的 编码 方案 ; 目前， 其 中 最 流行 的 编码 方案 是 4B/5B 编码 方法 ,使 用 NRZI 信号 方式 














.EIA/TIA 
Category 1 


最 大 干扰 
噪音 和 ”low speed" 数据 (4 一 9. 6 kHz) 
1 Mbps 或 更 少 
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每 5 个 波 特 传输 4 位 信号 ， 如 图 11-14 所 示 。 





起 始 分 界 符 结束 分 界 符 








图 11-14 4B/5B 编码 方式 


波 特 〈baud) 是 一 种 信号 转换 (路 变 ) 数目 的 度量 单位 ， 这 种 度量 是 针对 在 一 个 媒体 中 由 某 种 传 
输 介 质 或 传输 方法 所 支持 的 信号 的 传输 过 程 。 对 于 非 语音 电话 网 而 言 ， 线 路 的 速度 是 用 赫兹 单位 来 度 
量 的 。 而 对 于 数字 信和 号 来 说 ， 替 效 单 位 和 波 特 单位 是 等 价 的 。 正 如 在 图 11-14 中 所 看 到 的 那样 ， 如 果 
网 络 使 用 4B/5B 编码 方法 ,那么 125MHz 的 信号 传送 能 力 要 求 传输 线路 必须 有 一 个 100Mbys 的 比 
特 率 。 


Wi 
pl 





光缆 网 络 介 质 比 双 绞 线 或 同 轴 电 缆 传输 信号 更 快 并 且 更 远 。 理 论 上 上， 光缆 能 够 支持 的 传输 频率 在 
太 赫 (THz， 百 亿 赫 兹 ) 范围 ， 但 是 通常 的 传输 速率 在 2 千 兆 赫 (GHz) 以 内 ,传输 的 距离 为 10~ 
100km (不 需要 使 用 转发 器 ) 。 光 缆 是 由 一 东 细 小 《1. 5~125 nm) 的 外 面 带 有 防护 塑料 外 套 的 玻璃 纤 
维 或 塑料 线 绳 组成。 虽然 光纤 传输 的 物理 原理 完全 不 同 ,但 是 我 们 可 以 把 光纤 看 作 是 一 种 光 的 导体 ， 
就 像 把 铜 导体 看 作 电 的 导体 一 样 。 光 缆 是 一 种 “ 光 导 (light guide)” 类 型 ， 它 可 以 把 光 从 光缆 的 一 端 
传输 另 一 端 。 在 发 送 端 ， 发 光 二 极 管 或 激光 二 极 管 会 发 射出 各 种 光 脉 冲 ， 这 些 光 脉冲 将 沿 着 玻璃 纤维 
绳 传播 ， 就 好 像 水 流 过 水 管 一 样 。 在 接收 端 光 探测 器 会 把 光 脉 冲 转化 为 电信 号 ， 这 些 电信 号 可 以 由 各 
种 电子 设备 进行 处 理 。 

光缆 支持 3 种 不 同 的 传输 模式 ， 具 体 使 用 哪 种 传输 模式 要 取决 于 所 使 用 光缆 的 类 型 。 各 种 不 同 的 
光缆 类 型 如 图 11-15 所 示 。 最 细小 (narrowest) 的 光缆 叫做 单 模 〈single-mode) 光纤 ， 只 能 传送 一 种 
波长 的 光 ， 典 型 的 波长 为 850、1300 或 1500 nm。 单 模 光纤 可 以 有 最 快 数据 传输 率 和 最 远 的 传输 距离 。 
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多 模 《multimode) 光纤 可 以 通过 一 个 较 大 的 光纤 芯 同 时 
传输 几 个 不 同 的 波长 光 。 在 多 模 光 纤 中 ， 激 光波 会 在 光纤 芯 
的 壁 上 来 回 反 射 ， 这 样 导致 比 单 模 光 纤 有 更 大 的 衰减 。 这 里 ， 
光波 不 但 会 发 生 散 射 ， 而 且 会 在 某 种 程度 上 相互 碰撞 ， 从 而 












造成 进一步 的 衰减 。 b) 多 模 光纤 
多 模 渐变 型 (multimode graded index) 也 支持 多 个 不 同 F222 


波长 的 光 同 时 传输 ， 但 是 与 常规 的 多 模 光 纤 相 比 ， 多 模 渐变 0) 渐变 型 光纤 
型 光纤 采用 一 种 更 加 可 控 的 方式 进行 光 传输 。 多 模 渐 变型 光 图 11-15 光纤 


纤 由 一 些 同 轴 心 的 塑料 或 玻璃 层 组 成 ， 每 层 的 折射 特性 都 优 

化 成 适合 传送 特定 的 波长 。 像 常规 多 模 光 纤 一 样 ， 光 波 会 以 反射 波动 的 方式 通过 多 模 渐变 型 光纤 。 但 
是 与 常规 的 多 模 光 纤 不 同 的 是 ， 在 多 模 渐 变型 光纤 中 ,不 同 波长 的 光 会 被 限制 在 光纤 中 的 不 同 区 域 ， 
这 些 区 域 适合 于 传播 特定 波长 的 光 。 因 此 ， 不 同 的 波长 的 光 通 过 纤维 同时 传输 时 相互 之 间 并 不 会 发 生 
干涉 。 

光纤 介质 相对 于 铜 导线 来 说 有 更 多 的 优点 。 最 明显 的 特点 是 光纤 介质 信号 具有 巨大 的 信和 号 传送 能 
力 。 而 且 不 受 EMI 和 RF] 的 于 扰 ， 是 工业 设施 上 是 应 用 的 理想 材料 。 光 纤 既 小 又 轻 ， 一 根 光纤 可 以 将 
代 几 百 对 铜 导线 。 

但 是 ， 光 缆 很 胸 ， 购 买 和 安装 的 费用 也 都 比较 高 。 由 于 这 些 原 因 ， 光 纤 通 常用 作 网 络 的 主干 高 
速 电 缆 〈backbone cable) ， 能 够 承受 上 百 个 或 上 千 个 用 户 的 通信 量 。 这 种 高 速 电缆 就 像 一 条 州 际 公 
路 ， 车辆 只 能 够 通过 特定 的 人 口 和 出 口 的 访问 进入， 然而 在 这 条 高 速 公路 上 可 以 很 高 速 地 通过 大 量 
的 交通 流量 。 当 车 辆 到 达 最 终 目 的 地 时 ， 必 须要 离开 高 速 公路 ， 然 后 可 能 要 驶 人 一 条 住宅 区 的 街道 。 
住宅 区 街道 的 网 络 最 通常 采用 的 形式 是 铜 双 绞 线 。 这 种 “住宅 区 街道 ”的 铜 导线 有 时 也 称 为 横向 电 
绕 〈horizontal cable)， 它 不 同 于 主干 电缆 (纵向 电缆 ，vertical cable) 。 毫 无 疑问 ， 随 着 成 本 的 降低 ， 
“光纤 连 到 书桌 ”这 种 情况 最 终 会 成 为 现实 。 与 此 同时 ， 在 同一 个 电缆 土 集成 传输 语音 和 视频 数据 的 
需求 正在 稳步 增加 。 随 着 这 些 新 技术 的 发 展 ， 在 下 一 代 高 速 电缆 引进 之 前 ， 网 络 介质 可 能 会 延伸 到 
它们 的 极限 。 


11.6.2 网 络 接口 卡 


传输 介质 是 通过 网 络 接口 连接 到 客户 机 、 主 机 和 其 他 网 络 设备 的 。 由 于 这 些 接口 常常 是 在 一 些 可 
移动 电路 板 上 实现 的 ， 所 以 它们 通常 被 称 为 网 络 接 口 卡 (network interface cards，NIC) ， 或 简称 为 网 
卡 《〈 请 不 要 称 作 “NIC 卡 ”1) 。 网 卡通 常 嵌 和 人 OSI 协议 堆栈 的 最 下 面 的 三 层 。 它 是 一 个 连接 网 络 物理 设 
备 和 计算 机 系统 之 间 的 桥梁 。NIC 一 般 直接 连接 到 系统 的 主 总 线 上 或 者 是 专用 的 IO 总 线 上 。 网 卡 会 
将 系统 总 线 上 通过 的 并 行 信和 号 转换 为 通信 介质 上 传播 的 串 行 信号 。 网 卡 还 负责 把 二 进 制 编码 的 数据 转 
化 为 网 络 上 的 曼彻斯特 编码 或 4B/5B 编码 的 数据 ， 反 之 亦 然 。 网 卡 还 同时 提供 各 种 物理 连接 ， 以 及 协 
商 允许 将 信号 放 到 网 络 介质 上 。 

每 个 网 卡 都 有 唯一 的 物理 地 址 并 国 化 在 网 卡 的 电路 中 。 这 个 地 址 称 为 介质 访问 控制 (Media 
Access Control，MAC) 地 址 ， 长 度 为 6 个 字 节 。 前 3 个 字 节 是 制造 商 的 标识 码 ， 由 IEEE 来 指定 。 后 
3 个 字 节 是 由 制造 商 分 配 网 卡 的 唯一 标识 码 。 世 界 上 任何 两 个 网 卡 的 MAC 地 址 都 是 不 同 的 。 网 络 的 协 
议 层 会 将 这 个 物理 MAC 地 址 映射 到 至 少 一 个 逻辑 地 址 。 这 个 逻辑 地 址 是 网 络 上 的 一 个 节点 相对 于 其 
他 节点 的 名 称 或 地 址 。 一 台 计 算 机 〈 逻 辑 地 址 ) 可 能 有 两 个 或 更 多 的 网 卡 ， 但 是 每 个 网 卡 都 有 一 个 不 
同 的 MAC 地 址 。 


11.6.3 转发 器 
一 个 小 型 办 公 室 的 局 域 网 的 安装 ， 相 互 之 间 只 有 几 英尺 的 间隔 ， 可 能 需要 许多 网 卡 。 然 而 ， 在 
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一 个 复杂 的 办 公 室 局 域 网 中 ， 网 卡 可 能 会 被 几 百 英尺 长 的 电缆 隔 开 。 电 缆 越 长 ， 信 号 衰减 越 大 。 要 
减 小 这 种 信和 号 衰减 的 影响 ， 可 以 减 小 传输 速度 (通常 这 是 一 个 令 人 难以 接受 的 选择 )， 或 者 向 网 络 增 
加 转发 器 。 转 发 器 〈repeater， 或 称 为 中 继 器 ) 可 以 通过 放大 信号 来 应 对 信号 通过 网 络 物理 电缆 时 所 
发 生 的 衰减 问题 。 任 何 网 络 所 需要 的 转发 器 的 数目 取决 于 信号 传输 的 距离 、 传 输 使 用 的 介质 和 线路 
中 信号 传输 的 速度 。 例 如 ， 高 频 铜 导线 每 公里 需要 的 转发 器 数量 要 比 工作 在 同等 频率 下 的 光纤 需要 
的 转发 器 多 。 - 

转发 器 是 网 络 介质 的 一 部 分 。 从 理论 上 来 说 ， 它 们 是 一 些 完全 无 需 人 为 干预 的 被 动工 作 的 设备 。 
同样 ， 转 发 器 不 包含 任何 网 络 地 址 的 设备 。 但 是 ， 现 在 有 些 转发 器 可 以 提供 一 些 高 级 服务 ， 帮 助 网 络 
等 理 ， 以 及 进行 故障 诊断 和 修复 。 图 11-16 是 一 个 转发 器 再 生 套 减 数字 信和 号 的 示意 图 。 





一 | 
衰减 的 信号 转发 器 再 生 的 信号 
图 11-16 在 OSI 模型 中 的 转发 器 的 功能 


11.6.4 集线器 


转发 器 是 物理 层 设 备 ， 只 有 一 个 输入 端口 和 一 个 输出 端口 。 集 线 器 (hub) 也 是 物理 层 设 备 ， 但 
是 它 可 以 有 多 个 输入 端口 和 输出 端口 。 集 线 器 既 可 以 接收 来 自 一 个 或 多 个 位 置 的 数据 包 ， 也 可 以 在 
网 络 上 将 数据 包 传播 到 一 个 或 多 个 设备 。 集 线 器 允许 计算 机 相互 连接 在 一 起 形成 网 络 链接 段 〈net- 
work segment) 。 最 简单 的 集线器 是 连接 不 同 的 网 络 分 支 的 转发 器 。 物 理 网 络 分 支 通 过 集线器 连接 在 
一 起 ,不 会 以 任何 方式 将 网 络 分 割 开 来 。 严 格 地 说 ， 集 线 器 是 第 1 层 设备 ， 它 们 并 不 会 关心 数据 包 
的 来 源 和 目的 地 。 不 管 集线器 存在 与 否 ， 网 络 上 的 每 个 站 点 都 会 与 网 络 上 的 其 他 站 点 继续 竞争 来 占 
用 带宽 。 因 为 集线器 是 第 1 层 设备 ， 所 以 连接 集线器 的 所 有 端口 的 物理 介质 必须 是 相同 的 。 可 以 认 
为 集线器 除了 提供 多 站 点 来 访问 物理 网 络 之 外 ， 并 不 比 转发 器 的 功能 多 。 图 11-17 表示 一 个 有 3 个 
集线器 的 网 络 。 


3 Da 


图 11-17 采用 集线器 连接 的 网 络 
随 着 集线器 结构 的 发 展 ， 现 在 有 许多 集线器 可 以 连接 不 同类 型 的 物理 介质 。 尽 管 像 这 样 介质 
互 连 是 第 2 层 的 功能 ， 但 是 制造 商 继续 把 这 些 设 备 叫做 集线器 。 交 换 式 集线器 (switching hub) 
和 智能 型 集线器 (intelligent hub) 的 出 现 进一步 削弱 了 集线器 属于 “第 1 层 设备 ”的 概念 。 这 些 
复杂 的 设备 不 仅 能 够 连接 不 同类 型 的 介质 ， 而 且 可 以 执行 完全 属于 第 3 层 的 路 由 选择 和 协议 会 话 
的 基本 功能 。 


11.6.5 交换 机 
交换 机 是 第 2 层 设备 ， 可 以 在 它 的 输入 端口 和 输出 端口 之 间 产 生 点 对 点 连接 。 虽 然 集线器 和 交换 
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机 执行 相同 的 功能 ， 但 是 它们 在 内 部 处 理 数据 的 方式 是 不 同 的 。 集 线 器 向 网 络 上 所 有 的 计算 机 传播 数 
据 包 ,而且 每 次 只 处 理 一 个 数据 包 。 另 一 方面 ， 交 换 机 能 够 处 理 与 它们 相连 的 计算 机 之 间 的 多 路 通信 ，。 
如 果 网 络 上 只 有 两 台 计 算 机 ， 那 么 集线器 和 交换 机 的 行为 方式 完全 相同 。 如 果 网 络 上 有 多 台 计 算 机 正 
在 进行 通信 ， 那 么 交换 机 具有 更 好 的 性 能 ， 因 为 交换 机 的 两 端 可 以 使 用 网 络 的 全 带宽 。 因 此 ， 在 大 多 
数 网 络 安装 中 ， 交 换 机 优 于 集线器 。 在 第 9 章 中 ， 我 们 介绍 了 处 理 器 连接 存储 器 或 处 理 器 连接 处 理 器 
的 交换 机 。 那 里 的 交换 机 和 我 们 现在 讨论 的 交换 机 属于 同一 种 类 型 。 交 换 机 包含 一 定数 目的 带 缓冲 器 
的 输入 端口 ， 相 同 数目 的 输出 端口 ， 一 个 开关 网 络 结构 〈switching fabric， 这 个 结构 由 多 个 开关 单元 、 
集成 电路 和 人 允许 控制 交换 路 径 的 程序 的 组 合 构成 ) 和 数字 硬件 系统 。 数 字 硬 件 系统 在 网 络 数据 帧 到达 
输入 缓冲 器 时 ， 负 责 解 释 网 络 数据 帧 中 编码 的 地 址 信息 。 

与 所 讨论 的 大 多 数 网 络 设备 一 样 ， 通 过 增加 可 编 址 和 管理 特性 可 以 改进 交换 机 的 性 能 。 现 在 ， 大 
多 数 交 换 机 都 可 以 报告 它们 所 处 理 的 信息 量 的 数量 和 种 类 ， 甚 至 还 可 以 根据 用 户 提供 的 参数 过 滤 某 些 
网 络 数据 包 。 因 为 所 有 的 交换 功能 都 采用 硬件 的 形式 执行 ， 所 以 对 于 高 性 能 网 络 设备 的 互 连 ， 交 换 机 
是 优先 选择 的 设备 。 


11.6.6 网 桥 和 网 关 


网 桥 (bridge) 和 网 关 〈gateway) 的 目的 都 是 在 两 种 不 同类 型 的 网 络 段 之 间 提 供 一 种 链接 。 二 者 
都 可 以 支持 不 同 的 介质 (和 网 速 )， 而 且 它 们 也 都 是 “存储 和 转发 (store and forward)” 设 备 ， 在 发 送 
帧 之 前 会 保存 整个 数据 帧 。 这 些 都 是 它们 的 相似 之 处 。 

网 桥 用 来 连接 两 个 同类 型 的 网 络 ， 这 样 使 它们 看 起 来 像 是 一 个 网 络 。 如 果 使 用 网 桥 ， 那 么 这 个 网 
络 上 的 所 有 计算 机 都 属于 同一 个 子 网 (subnet， 子 网 是 由 具有 同样 前 级 的 IP 地 址 的 设备 组 成 的 网 络 ) 。 
网 桥 是 相对 简单 的 设备 ， 它 的 主要 功能 集中 在 第 2 层 。 也 就 意味 着 网 桥 不 了 解 协议 的 任何 内 容 ， 只 是 
简单 地 依据 目标 地 址 将 数据 转发 出 去 。 网 桥 可 以 连接 具有 不 同 介质 访问 控制 协议 的 不 同类 型 的 介质 ， 
但 是 经 过 OSI 堆栈 中 的 所 有 较 高 层次 来 自 MAC 层 的 协议 ， 在 两 个 链接 的 网 络 段 中 必须 是 相同 的 。 这 
种 关系 如 图 11-18 所 示 。 
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图 11-18 连接 两 个 网 络 的 网 桥 

连接 到 任何 一 个 特定 网 桥 的 每 个 节点 都 必须 有 唯一 的 地 址 。 这 里 ，MAC 地 址 是 最 常用 的 地 址 。 网 
络 管理 员 必 须 利 用 这 些 地 址 和 网 络 上 每 个 有 效 节点 的 网 络 段 号 对 网 桥 进行 简单 编程 。 允 许 通 过 网 桥 的 
唯一 数据 是 正在 被 发 送 到 网 桥 另 一 端的 一 个 有 效 地 址 的 数据 。 对 于 大 型 网 络 而 言 ， 各 种 情况 的 变化 很 
频繁 〈 大 多 数 网 络 都 是 如 此 )， 这 种 频繁 的 再 编程 是 非常 乏味 的 ， 即 浪费 时 间 又 容易 出 错 。 后 来 发 明了 
透明 网 桥 (transparent bridge) 就 是 为 了 减轻 这 种 网 络 管理 员 的 再 编程 问题 。 透 明 网 桥 是 一 些 复杂 的 
设备 ， 它 们 能 够 知道 在 每 个 网 络 段 上 的 每 个 设备 的 地 址 。 透 明 网 桥 还 提供 了 信息 管理 ， 如 报告 吞吐 量 
等 。 这 样 的 功能 实际 上 暗示 了 网 桥 已 经 不 此 是 完全 属于 第 2 层 的 设备 。 然 而 ， 网 桥 仍 要 求 在 互 连 的 两 
个 网 络 段 具有 相同 的 网 络 层 协 议和 相同 类 型 的 接口 。 

图 11-18 表示 的 是 两 个 不 同 种 类 的 局 域 网 通过 一 个 网 桥 连 接 在 一 起 。 这 是 网 桥 的 典型 使 用 方法 。 
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但 是 ， 如 果 这 些 局 域 网 上 的 用 户 需要 连接 到 一 个 使 用 完全 不 同 的 协议 的 系统 ， 例 如 一 个 公共 交换 电话 
网 或 者 是 一 个 使 用 非 标准 专用 协议 的 主机 ， 那 么 就 需要 使 用 网 关 (gateway)。 网 关 是 另 一 个 网 络 的 人 
口 点 。 网 关 是 一 种 完备 的 计算 机 系统 ， 它 可 以 跨越 所 有 的 OSI 的 ?7 个 层次 提供 通信 服务 。 网 关 的 系统 
软件 可 以 进行 转换 协议 和 字符 编码 的 工作 ， 而 且 能 够 提供 加 密 和 解密 服务 。 因 为 网 关 是 利用 软件 处 理 
大 量 的 这 类 工作 ， 所 以 网 关 不 能 够 提供 类 似 于 基于 硬件 的 网 桥 的 吞吐 量 ， 然 而 网 关 通 过 提供 更 多 的 功 
能 来 弥补 这 个 缺陷 。 通 常 ， 网 关 是 直接 连接 到 交换 机 或 路 由 器 的 。 


11.6.7 路 由 器 和 路 由 


路 由 器 是 继 网 关 之 后 ， 网 络 上 第 二 复杂 的 设备 。 事 实 上 ， 路 由 器 是 一 些小 型 的 专用 计算 机 。 路 由 
器 (router) 是 至 少 连接 两 个 网 络 的 设备 ， 路 由 器 可 以 决定 一 个 数据 包 应 该 被 转发 到 的 目的 地 。 路 由 器 
通常 设置 在 网 关上 。 如 果 操 作 正确 ， 路 由 器 能 够 使 网 络 运行 得 更 快 并 做 出 及 时 的 响应 。 如 果 操 作 不 正 
确 ， 则 有 故障 的 路 由 器 可 能 会 降低 整个 系统 的 性 能 。 本 节 将 揭示 路 由 器 的 内 部 工作 原理 ， 并 且 讨 论 路 
由 器 需要 解决 的 一 些 棘手 问题 。 

尽管 路 由 器 非常 复杂 ， 但 是 通常 把 它们 看 作 第 3 层 设备 ， 因 为 它们 的 大 部 分 工作 都 是 在 OSI 参考 
模型 的 网 络 层 上 完成 的 。 然 而 ， 大 多 数 路 由 器 还 提供 了 一 些 网 络 监 视 、 管 理 和 故障 诊断 服务 。 央 为 路 
由 器 是 定义 在 第 3 层 的 设备 ， 所 以 它们 能 够 桥接 不 同类 型 的 网 络 介质 〈 例 如 光纤 对 铜 导线 ) 和 连接 运 
行 在 第 3 层 或 以 下 的 不 同 的 网 络 协议 。 由 于 具有 这 些 功能 ， 所 以 在 网 络 标准 文献 中 ， 路 由 器 有 时 也 被 
称 为 “中 介 系 统 (intermediate system)” 或 “网 关 ”。 在 第 一 个 网 络 标准 写成 时 ， 还 没有 出 现 路 由 器 这 
个 词 。 

设计 路 由 器 是 专门 为 了 将 两 个 网 络 连接 在 一 起 ， 通 常 是 一 个 LAN 连接 一 个 WAN。 路 由 器 是 一 些 
非常 复杂 的 设备 ， 因 为 它们 不 但 包含 缓冲 器 和 开关 逻辑 ， 而 且 还 配 有 足够 的 存储 器 和 处 理 能 力 ， 计 算 
发 送 一 个 数据 包 到 目的 地 的 最 好 方法 。 典 型 的 路 由 器 的 内 部 概念 模型 如 图 11-19 所 示 。 


输入 
端口 





图 11-19 路 由 器 的 解剖 图 
在 大 型 网 络 中 ， 路 由 器 会 对 一 个 基本 上 属于 完全 NP 的 问题 找到 了 一 个 近似 的 解决 办 法 。 一 个 完 
全 NP 的 问题 在 理论 上 不 可 能 有 最 好 的 求解 方法 ， 但 是 如 果 计 算 的 时 间 周 期 足够 短 ， 那 么 对 解决 网 络 
问题 还 是 有 帮助 的 。 
考虑 如 图 11-20 所 示 的 网 络 。 我 们 可 以 认为 这 个 图 是 一 个 完全 图 (Ks)。 在 包含 个 节点 的 完全 图 
中 ， 有 n (n 一 1) /2 条 边 。 在 这 个 示意 图 中 ， 有 5 个 节点 和 10 条 边 。 这 些 边 分 别 代 表 每 个 节点 之 间 的 
路 由 或 跳 。 
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如 果 节 点 1 (路 由 器 1) 要 向 节点 2 发 送 一 个 数据 包 ， 那 么 它 有 如 下 路 由 路 径 可 以 选择 : 


到 终端 站 


图 11-20 ”完全 连接 网 络 图 

1 个 跳 1 种 路 由 : 1 一 2 

2 个 跳 3 种 路 由 : 1 一 3 一 2 1—>4—>2 1—>5—>2 

3 个 跳 6 种 路 由 : 1->3 一 4 一 2 1>3—>5—>2 1>5—>4—>2 

1>4—>3—2 1>5—>3—>2 1>4—>5—>2 
4 个 跳 6 种 路 由 : 1 一 3 一 4 一 5 一 2 1 一 4>3 一 5>2 1 一 5 一 4 一 3 一 2 
1>3>5—>4—>2 1—>4>5—>3—>2 1—>5>3—>4->2 

当 节 点 1 和 节点 2 不 是 直接 连接 时 ， 两 个 节点 之 间 的 交通 至 少 要 通过 一 个 中 间 节 点 。 如 果 考 虑 到 
所 有 的 情况 ， 那 么 可 能 发 生 的 路 由 数 是 N! 种 算法 。 当 代价 或 权 值 也 要 应 用 于 路 由 路 径 时 ， 这 个 问题 
会 变 得 更 加 复杂 。 更 糟糕 的 是 ， 权 值 随 着 交通 流量 的 变化 而 变化 。 例 如 ， 如 果 节 点 1 和 节点 2 之 间 的 
连接 是 一 条 收费 的 高 等 待 〈high-latency， 慢 ) 的 线路 ， 那 么 我 们 可 能 会 选择 使 用 1 一 4 一 5 一 3 习 2 这 条 
路 径 。 很 显然 ， 在 实际 的 网 络 中 有 几 百 个 路 由 器 ， 问 题 将 会 变 得 更 加 庞大 。 如 果 每 个 路 由 器 对 每 个 到 
达 的 数据 包 都 要 考虑 各 种 可 能 性 而 提出 理想 的 发 送 路 由 的 话 ， 那 么 数据 包 就 不 可 能 迅速 到 达 目 的 地 。 

当然 ， 在 只 有 少数 几 个 节点 的 非常 稳定 的 网 络 中 ， 每 个 路 由 器 总 是 使 用 最 佳 路 由 的 情况 是 可 能 的 。 
这 种 情况 称 为 静态 路 由 (static routing)， 对 于 集中 在 某 个 位 置 的 大 量 用 户 都 使 用 一 个 中 央 主 机 ， 或 一 
个 网 关 ， 而 在 另外 位 置 也 类 似 的 网 络 来 说 ， 这 种 最 佳 路 由 是 切实 可 行 的 。 从 短期 的 观点 来 看 ， 这 是 一 
种 非常 有 效 的 系统 互 连 方式 。 但 是 如 果 其 中 的 某 个 互 连 链 路 或 路 由 器 出 现 了 问题 ,， 那么 大 量 用 户 都 将 
无 法 连接 到 主机 。 这 样 ， 要 求 网 络 管理 人 员 必 须 快 速 做 出 反应 来 恢复 中 断 的 服务 。 在 网 络 状态 频繁 发 
生 改 变 的 情况 ， 静 态 路 由 不 是 一 种 合理 的 选择 。 这 就 是 说 ， 对 于 大 多 数 网 络 来 说 都 不 选择 使 用 静态 路 
由 。 相 反 ， 静 态 网 络 是 可 预测 的 和 可 控制 的 网 络 ， 每 个 数据 包 要 选取 的 路 由 路 径 〈 也 就 是 跳 数 ) 总 是 
已 知 的。 静态 路 由 同样 是 非常 稳定 的 ， 它 产生 的 是 无 路 由 协议 交换 的 通信 方式 。 

动态 路 由 器 会 自动 建立 路 由 路 径 ， 并 对 网 络 中 的 改变 做 出 响应 。 这 些 路 由 器 同样 可 能 会 选择 一 个 
最 优 的 路 由 和 一 条 备用 路 由 路 径 ， 以 便 出 现 问题 时 可 以 有 一 种 路 由 选择 。 动 态 路 由 器 不 会 改变 路 由 指 
令 ， 但 是 允许 路 由 表 发 生动 态 改变 。 

动态 路 由 器 可 以 通过 与 网 络 中 的 其 他 路 由 器 的 信息 交换 来 自动 检测 它们 所 在 的 网 络 。 通 过 路 由 器 
交换 的 信息 包 会 显示 它们 的 地 址 和 从 一 个 节点 到 另 一 个 节点 所 需 的 代价 。 通 过 使 用 这 些 信息 ， 每 个 路 
由 器 都 会 在 它们 的 存储 器 中 装配 一 个 路 由 表 。 实 际 上 ， 路 由 表 是 网 络 上 每 个 节点 的 一 个 可 到 达 性 列表 ， 
再 加 上 一 些 默 认 值 。 通 常情 况 下 ， 每 个 目标 节点 都 是 和 它 要 连接 的 相 邻 路 由 器 ， 即 下 一 跳 〈next- 
hop) ， 一 起 列表 的 。 

在 创建 路 由 表 时 ， 动 态 路 由 器 采取 下 面 两 种 方法 中 之 一 : 它们 或 者 使 用 两 个 节点 之 间 的 路 由 距离 ， 
或 者 根据 测量 的 延 时 时 间 来 考虑 网 络 状况 。 使 用 第 一 个 方法 的 算法 是 距离 失 量 路 由 《distance Vector 
routing) 算法 。 使 用 第 二 个 方法 的 算法 是 链接 状态 路 由 (link state routing) 算法 。 
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距离 撩 量 路 由 算法 是 从 1957 年 和 1962 年 发 明 的 两 个 算法 中 衍生 而 来 的 ， 这 两 个 算法 分 别 是 Bell- 
man-Ford 算法 和 Ford-Fulkerson 算法 。 距 离 矢 量 路 由 中 的 距离 (distance) 通常 是 指 对 数据 包 到 达 目 
标 节 点 前 必须 经 过 的 节点 〈 跳 ) 数 的 一 种 测量 ， 但 是 可 以 使 用 任何 一 种 测量 方法 。 例 如 ， 已 知 一 个 网 
络 如 图 11-21a 所 示 ， 其 中 有 4 个 路 由 器 和 10 个 节点 连接 在 一 起 。 如 果 节点 B 想 发 送 一 个 数据 包 到 达 
节点 L， 则 有 两 种 选择 : 第 一 个 方案 是 B-> 路 由 器 4 一 路 由 器 1>L。 在 路 由 器 4 和 路 由 器 1 之 间 有 一 次 
跳跃 。 第 二 种 路 由 方案 选择 在 路 由 器 之 间 进 行 三 次 跳跃 : B 习 路 由 器 4 一 路 由 器 3 一 路 由 器 2 一 路 由 器 
1->L。 通 过 使 用 距离 矢量 路 由 算法 ， 目 标 总 是 要 选择 最 短 的 路 由 路 径 ， 所 以 在 这 里 路 由 路 径 B> 路 由 
器 4 一 路 由 器 1>L 是 最 显而易见 的 选择 。 
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b) 从 路 由 器 1 和 路 由 器 3 的 路 由 表 来 构建 路 由 器 2 的 路 由 表 
图 11-21 带 有 路 由 器 的 例子 


在 距离 撩 量 路 由 算法 中 ， 每 个 路 由 器 需要 知道 与 它 相 连接 的 每 个 节点 的 身份 以 及 它们 之 间 的 跳 数 。 
为 了 有 效 地 完成 这 项 工作 ， 路 由 器 必须 与 它 相 邻 连接 的 路 由 器 交换 节点 和 跳 数 的 信息 。 例 如 ， 在 图 
11-21a 所 示 的 网 络 中 ， 路 由 器 1 和 路 由 器 3 的 路 由 表 如 图 11-21b 所 示 。 然 后 ， 把 这 两 个 路 由 表 发 送 到 路 
由 器 2。 如 图 所 示 ， 路 由 器 2 在 考虑 所 有 的 路 由 表 中 报告 的 路 由 路 径 后 ， 会 选择 到 达 任 何 一 个 节点 的 一 
条 最 短路 径 。 最 终 的 路 由 表 中 包含 直接 连接 到 路 由 器 2 的 各 个 节点 的 地 址 信息 ， 以 及 一 个 可 以 通过 其 他 
路 由 器 到 达 的 目标 节点 和 节点 的 跳 数 的 列表 。 注 意 ， 路 由 器 2 的 最 终 路 由 表 的 跳 数 增加 1 的 原因 是 ， 考 
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虑 了 路 由 器 1 和 路 由 器 2 以 及 路 由 器 2 和 路 由 器 3 之 间 有 1 个 跳跃 。 一 个 实际 的 路 由 表 还 应 该 包含 没有 
直接 连接 到 网 络 的 节点 所 使 用 的 默认 路 由 地 址 ， 例 如 某 个 远方 的 局 域 网 (LAN) 或 网 络 目标 的 站 点 。 

距离 矢量 路 由 算法 很 容易 实现 ， 但 是 它 却 存在 一 些 问题 。 首 先 ， 在 大 型 的 网 络 中 稳定 〈 或 者 会 聚 ， 
converge) 路 由 表 需 要 占用 的 时 间 比 较 长 。 另 外 ， 当 路 由 表 发 生 更 新 时 ， 网 络 上 会 产生 数量 可 观 的 信 
息 流 。 第 三 种 情况 是 ， 那 些 过 时 的 路 由 路 径 仍然 会 存放 在 路 由 表 中 ， 这 将 造成 错误 路 由 或 丢失 数据 包 
的 现象 发 生 。 最 后 一 个 问题 是 存在 无 限 计 数 〈countrto-infinity) 的 缺点 。 

通过 学 习 图 11-22a 中 的 网 络 ， 可 以 理解 无 限 计数 的 问题 。 值 得 注意 的 是 ， 网 络 上 存在 许多 宛 余 的 
路 径 。 例 如 ， 如 果 路 由 器 3 发 生 脱 机 掉 线 ， 客 户 端 仍然 可 以 连通 主机 和 网 络 ， 但 是 直到 路 由 器 3 再 次 
正常 运行 时 ， 它 们 才能 够 输出 打印 信息 。 


电子 邮件 间 


服务 器 上 EE 己 打印 
三 服务 关 
NE | | 


因特网 









[a Da) Li 


== 








时 间 太 0 时 间 t=1 时 间 本 2 


b) 4 个 路 由 器 看 到 c) 路 由 器 R3 探测 到 d) 路 由 器 3 发 现 通过 路 由 器 
网 络 的 路 由 。 链接 中 断 。 1 的 路 由 ， 并 公告 通过 4 
跳 接 入 网 络 的 路 由 。 





时 间 枉 3 时 间 夺 4 时 间 上 5 
6) 其 他 路 由 器 在 知道 它们 需要 路 “人 现在 路 由 器 R3 看 见 路 由 器 加 路 由 器 RI 和 R2， 根 据 R3 的 路 由 公 


由 器 3 访问 网 络 后 ， 更 新 路 R1 和 因特网 之 间 的 距离 是 5， 告 ， 利 用 更 新 的 R3 接 入 网 路 的 跳 数 

由 表 ， 以 反映 由 路 由 器 3 所 所 以 路 由 器 3 通过 对 R1 接 人 来 更 新 它们 自己 的 路 由 表 。 这 一 过程 

报告 的 接 入 网 络 的 新 距离 。 网 络 的 跳 数 加 1 更 新 自己 接 和 人 ” 会 持续 下 去 直到 它们 的 计数 器 游 出 。 
网 络 的 路 由 。 


图 11-22 a) 带 有 宛 余 路 径 的 网 络 例子 
b) 路 由 器 1、 路 由 器 2、 路 由 器 3 的 路 由 接 人 网 络 
c-g) 各 种 网 络 路 径 的 路 由 表 更 新 
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各 个 路 由 器 接 人 网 络 的 所 有 路 径 如 图 11-22b 所 示 。 我 们 把 这 种 网 络 快照 (snapshot) 的 开始 时 间 记 
为 上 一 0。 正 如 图 中 所 示 ， 路 由 器 1 和 路 由 器 2 都 使 用 路 由 器 3 连接 到 因特网 。 在 t= 二 0 和 :二 1 之 间 的 某 个 
时 间 ， 路 由 器 3 和 路 由 器 4 之 间 的 连接 信号 在 不 断 减弱 ， 据 说 是 有 人 拔 掉 了 这 些 路 由 器 之 间 的 连接 电线。 
在 t=1 时 ， 路 由 器 3 发 现 连 接 中 断 ， 但 是 它 刚刚 已 经 收 到 了 来 自 相 邻 两 个 路 由 器 的 路 由 表 更 新 数据 。 这 
两 个 路 由 器 都 公告 (advertise) 说 它们 自己 可 以 利用 3 跳 来 接 人 网 络 。 接 着， 路 由 器 3 认为 它 能 够 使 用 其 
中 的 一 个 路 由 器 连接 到 网 络 ， 并 且 更 新 相应 的 路 由 表 。 路 由 器 3 跳 选 路 由 器 1 作为 自己 接 人 网 络 的 下 一 
跳 ， 然 后 在 :一 2 时 刻 向 路 由 器 1 和 路 由 器 2 发 送 了 自己 的 路 由 表 。 在 :一 3 时 刻 ， 路 由 器 1 和 路 由 器 2 都 
收 到 了 路 由 器 3 已 经 更 新 的 接 人 网 络 需 要 的 跳 数 ， 因 此 ， 它 们 把 路 由 器 3 的 值 加 1《〈 因 为 它们 知道 距离 路 
由 器 3 还 需要 1 跳 )， 接 下 来 就 广播 它们 自己 的 新 的 路 由 表 。 这 个 循环 会 一 直 持续 下 去 ， 直 到 所 有 的 路 由 
器 的 跳跃 计数 都 达到 无 穷 大 为 止 。 这 意味 着 存放 跳 数 的 寄存 器 最 终 会 溢出 ， 导 致 整个 网 络 瘫痪 。 

通常 ， 可 以 使 用 两 种 方法 来 防止 这 种 情况 。 一 种 方法 是 对 于 无 穷 大 使 用 一 个 较 小 的 值 ， 便 于 较 早 
地 检测 出 问题 ， 如 在 某 个 寄存 器 溢出 之 前 就 发 现 问题 。 另 一 种 方法 是 采用 某 种 方式 来 阻止 像 我 们 这 个 
例子 中 所 出 现 的 短 周期 间 题 。 

一 些 高 级 复杂 的 路 由 器 使 用 一 种 方法 叫做 水 平分 割 (split horizon) 路 由 ， 来 保持 网 络 的 不 会 出 现 
短 周期 。 简 单 的 思路 是 : 路 由 器 不 使 用 相 邻 路 由 器 提供 的 路 由 选择 ， 也 包括 本 身 的 路 由 。 类 似 地 ， 路 
由 器 可 以 自我 发 展 和 使 用 自 参 考 路 由 ， 但 是 要 设置 路 径 的 值 为 无 穷 大 。 这 种 方式 称 为 带 有 破坏 性 反 转 
的 水 平分 割 。 这 种 路 由 是 “破坏 性 的 ”， 因 为 它 被 标记 为 不 可 到 达 。 就 上 面 这 个 例子 而 言 ， 使 用 水 平分 
割 路 由 方式 的 路 由 表 交 换 的 接 人 网 络 的 路 径 将 会 收敛 〈converge)， 如 图 11-23 所 示 。 当 然 ， 仍 然 会 发 
生 较 大 循环 的 问题 。 例 如 路 由 器 1 指向 路 由 器 2， 路 由 器 2 指向 路 由 器 3， 路 由 器 3 指向 路 由 器 1。 这 
种 问题 可 以 得 到 某 种 程度 的 改善 ， 做 法 是 只 有 当 一 个 链接 需要 更 新 时 ， 路 由 器 才 交 换 它们 的 路 由 表 。 
这 种 更 新 称 为 触发 更 新 (triggered update) ， 采 用 这 种 方式 发 生 的 更 新 ， 能 够 导致 路 由 图 中 的 循环 数目 
较 少 ， 而 且 可 以 减少 网 络 中 的 交通 流量 。 





时 间 三 1 时 间 {=2 时 间 三 3 
R3 bb ee c) R3 看 见 了 它 接 入 网 络 的 最 
扣 太 天 又 约 链 反 。 由 时 加 全 R3， 阶 以 民 3 会 


短路 由 是 经 过 R1， 并 且 会 相 
应 地 更 新 其 路 由 表 。 


的 路 由 交会 找到 一 条 较 短 的 
路 由 路 径 。 


11-23 具有 破坏 性 反 转 的 水 平分 割 路 由 


在 大 型 网 络 中 ， 跳 数 可 能 是 一 个 会 产生 误导 的 度量 标准 ， 特 别 是 当 网 络 包含 各 种 不 同 的 设备 和 线 
路 速度 时 。 例 如 ， 如 果 一 个 数据 包 可 以 有 两 种 方式 到 达 某 处 。 一 种 方式 是 在 100Mb/s 的 局 域 网 
(LAN) 上 经 过 6 个 路 由 器 。 另 一 种 方式 就 是 在 64Kb/s 的 租用 电话 线路 上 经 由 2 个 路 由 器 。 虽 然 这 个 
100Mb/s 的 LAN 可 以 提供 超过 10 倍 的 吞吐 量 ， 但 是 跳 数 的 度量 结果 将 使 数据 包 的 信息 流 进 入 较 慢 的 
租用 电话 线路 。 如 果 我 们 不 测量 跳 数 ， 而 是 测量 实际 线路 的 延 时 ， 那么 就 可 以 防止 出 现 这 样 的 反常 情 
况 。 这 正 是 链接 状态 路 由 方法 (link state routing) 的 基本 思想 。 

与 距离 矢量 路 由 方法 一 样 ， 链 接 状 态 路 由 也 是 一 种 自我 管理 的 系统 。 每 个 路 由 器 通过 周期 性 发 送 
问候 〈Hello) 数据 包 来 发 现 它 自己 及 其 相 邻 的 路 由 器 之 间 的 线路 速度 。 只 要 路 由 器 一 释放 问候 包 ， 它 
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就 开始 计时 。 接 下 来 ， 接 收 到 问候 包 的 每 个 路 由 器 都 会 立即 发 送 一 个 回复 。 当 启动 的 路 由 器 收 到 一 个 
回复 后 ， 它 就 会 停止 计时 ， 并 将 计时 的 结果 值 除 以 2， 这 样 就 估算 出 到 达 给 出 回复 的 路 由 器 的 单 向 链 
接 所 需要 的 时 间 。 在 收 到 了 所 有 的 回复 之 后 ， 路 由 器 会 把 所 有 的 时 间 整 合成 一 个 路 由 状态 值 表 。 然 后 ， 
这 个 路 由 状态 表 会 向 其 他 所 有 的 路 由 器 广播 ， 但 是 和 它 相 邻 的 路 由 器 除外 。 不 邻近 的 路 由 器 会 利用 这 
个 信息 更 新 包括 发 送 路 由 器 在 内 的 所 有 路 由 路 径 。 最 后 ， 在 路 由 范围 内 的 所 有 路 由 器 都 有 同样 的 路 由 
表 。 简 单 地 说 ， 在 这 种 趋同 现象 发 生 后 ， 一 次 单一 的 网 络 快照 会 存在 于 每 个 路 由 器 的 路 由 表 中 。 然 后 ， 
路 由 器 会 使 用 图 像 来 计算 其 路 由 表 中 每 个 目标 节点 的 最 优 路 径 。 

在 计算 最 优 路 由 时 ， 每 个 路 由 器 都 会 被 编程 ， 认 为 它 自 己 是 一 个 树 结构 的 根 节点 ， 而 每 个 目标 节 
点 都 是 这 棵 树 的 一 个 内 部 叶 节 点 。 利 用 这 种 概念 ， 路 由 器 使 用 Dijkstra 算法 ?来 计算 到 达 每 个 目标 节点 
的 最 优 路 径 。 找 到 这 个 最 优 路 径 后 ， 路 由 器 只 是 存储 沿 着 这 个 路 径 的 下 一 跳 ， 而 不 是 存储 整个 路 径 。 
下 一 个 节点 〈 沿 最 优 路 径 下 游 ) 的 路 由 器 也 应 该 已 经 计算 出 了 同样 的 最 优 路 径 ， 或 者 是 数据 包 到 达 节 
点 时 刻 计算 出 的 更 好 路 径 。 而 这 个 数据 包 采 用 的 路 径 是 上 游 节点 计算 出 的 最 优 路 径 中 的 下 一 个 链接 。 
对 图 11-22 中 的 路 由 器 1 应 用 了 Dijkstra 算法 后 ， 路 由 器 1 所 看 到 的 网 络 路 由 如 图 11-24 所 示 。 





11-24 在 图 11-22a 中 使 用 链接 状态 路 由 和 Dijkstra 算法 后 ， 路 由 器 1 如 何 看 待 网 络 

很 清楚 ， 路 由 器 只 能 保持 有 限 的 信息 。 一 旦 网 络 达到 性 能 开始 下 降 的 规模 时 ， 网 络 就 必须 被 分 割 
成 若干 个 子 网 络 ， 或 称 为 网 络 段 (segments) 。 通 常 ， 这 种 情况 的 发 生 有 许多 原因 ， 而 不 仅仅 是 路 由 表 
饱和 。 在 一 些 大 型 网 络 中 ,应 用 分 层 结构 的 拓扑 将 有 助 于 保持 系统 的 可 管理 性 。 这 种 分 层 结构 组 合 了 
交换 技术 和 路 由 技术 。 最 好 的 网 络 设计 师 非常 清楚 地 了 解 网 络 设计 中 何 时 应 该 使 用 什么 技术 。 当 然 ， 
网 络 设计 的 最 终 目 标 是 使 网 络 的 吞吐 量 达 到 最 大 化 ， 同 时 保持 网 络 易于 管理 和 性 能 稳定 。 图 
什么 是 防火 均 

实际 上 ,政府 机 关 、 工 业 和 学 术 界 的 每 个 人 在 日 常事 务 过 程 中 都 会 使 用 网 络 。 每 一 个 人 都 可 以 接触 
到 网 络 ， 甚 至 包括 窃取 或 摧毁 某 个 公司 的 计算 资源 的 人 。 因 此 ， 如 何 
保持 网 络 对 每 个 使 用 网 络 进 行 工 作 的 人 员 有 是 够 的 访问 权限 ， 同 时 又 
保证 公司 的 财产 有 足够 安全 呢 ? 解决 这 个 问题 的 首选 办 法 是 在 企业 内 
部 网 和 因特网 之 间 设置 一 道 防火 墙 。 

防火 墙 (firewall) 的 名 称 ， 是 根据 在 相 邻 建筑 物 之 间 设 置 一 堵 
高 砖 墙 的 类 似 得 来 的 。 如 果 其 中 的 某 个 建筑 物 发 生 了 火灾 ， 那 么 相 邻 
的 建筑 物 就 会 因为 中 间 高 墙 而 受到 保护 ， 免 受 火灾 的 侵袭 。 因 此 ， 防 
火 墙 是 一 种 网 络 的 防火 墙 : 利用 防火 墙 可 以 把 网 络 的 内 部 用 户 与 某 些 
可 能 会 破坏 内 部 网 络 结构 的 外 来 用 户 分 隔 开 来 。 

防火 墙 有 许多 种 类 。 最 常用 的 有 两 种 类 型 ， 分 别 是 基于 路 由 器 的 
防火 墙 和 基于 主机 的 防火 墙 、 或 者 说 是 基于 代理 服务 器 的 防火 墙 。 这 
两 种 防火 墙 都 采用 同一 种 规则 基础 进行 规划 ， 这 种 规则 被 称 为 策略 








名 对 于 Dijkstra 算 法 的 解释 请 参阅 附录 A。 
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(policy)。 防 火 墙 的 策略 是 规定 哪些 类 型 的 网 络 地 址 允许 访问 哪些 类 型 的 服务 。 策 略 的 一 个 非常 好 的 示 
例 是 与 文件 传输 有 关 的 例子 。 通 过 对 防火 墙 进行 编程 ， 允 许 网 络 内 部 用 户 (网 络 中 受 保护 的 一 方 》 可 
以 从 因特网 下 载 文 件 ， 而 禁止 网 络 外 部 用 户 从 内 部 网 络 上 下 载 文 件 。 原 因 是 网 络 内 部 的 数据 可 能 包含 
有 一 些 敏 感 的 私人 信息 。 任 何 一 个 防火 墙 都 可 以 对 一 个 要 禁止 的 地 址 列表 编程 ， 有 时 候 也 叫 黑 名 单 。 
列 人 黑 名 单 的 地 址 中 通常 会 包括 散播 一 些 引 起 异议 的 信息 网 站 。 | 

两 种 类 型 的 防火 墙 还 能 够 区 分 人 站 和 出 站 的 流量 。 这 样 可 以 防止 地 址 欺骗 ， 愚 弄 防 火 墙 误 以 为 使 
用 这 个 地 址 用 户 在 网 络 内 部 ， 而 实际 上 这 是 一 个 网 络 外 部 的 用 户 。 如 果 防 火 墙 不 能 识别 地 址 欺骗 ， 那 
么 网 络 外 部 的 用 户 就 可 以 自由 出 入 内 部 网 络 。 

路 由 器 防火 墙 和 代理 服务 器 防火 墙 都 有 能 力 对 网 络 的 交通 进行 加 密 。 加 窗 (encrytion) 是 使 用 某 
种 算法 和 密 钥 值 打 乱 消息 的 排列 顺序 的 过 程 ， 只 有 具有 相应 的 密 钥 的 设备 才能 够 读 取 加 密 的 消息 。 密 
钥 值 是 周期 性 的 改变 ， 通 常 是 每 天 都 发 生 改 变 。 当 使 用 密 铀 交换 程序 对 防火 墙 进行 编程 时 ， 这 种 改变 
过 程 就 会 自动 发 生 。 路 由 器 倾向 于 使 用 较 简单 的 加 密 算 法 ， 常 用 的 算法 是 使 用 消息 和 密 钥 值 进行 简单 
的 移 位 和 逻辑 与 (AND) 操作 。 其 中 一 种 算法 是 美国 联邦 数据 加 密 标 准 (Data Encrytion Standard， 
DES) 。 为 了 更 加 安全 ， 有 时 要 对 消息 加 密 3 次 ， 这 种 做 法 称 为 3-DES。 

读者 可 以 想像 ， 代 理 服务 器 防火 墙 要 比 路 由 器 防火 墙 的 速度 更 慢 、 更 容易 失效 。 但 是 它们 比 路 由 
器 防火 墙 具 有 更 多 的 特点 。 首 先 ， 它 们 具有 可 以 为 内 部 网 络 用 户 担当 代理 的 能 力 ， 因 此 又 叫做 代理 
(proxy) 服务 器 。 这 些 系统 通常 配备 2 块 网 卡 ， 即 它们 有 双向 作用 〈dual homed) 。 其 中 一 块 网 卡 连接 
内 部 网 络 ， 另 一 块 网 卡 连 接 外 部 网 络 。 利 用 这 样 的 配置 ， 服 务 器 可 以 对 外 部 网 络 用户 完 全 屏蔽 掉 内 部 
网 络 的 特性 。 外 部 网 络 用户 所 能 够 看 到 的 仅仅 是 连接 外 部 网 络 的 网 卡 地 址 。 

服务 器 防火 墙 还 可 以 保存 大 量 的 网 络 日 志 。 通 过 这 些 日 志 ， 安 全 管理 员 能 够 发 现 大 部 分 黑客 的 人 
侵 企图 。 在 某 些 情况 下 ， 日 志 可 以 提供 有 关 人 和 人 侵 者 的 信息 。 机 


11.7 高 容量 数字 链 路 


既然 读者 理解 了 数据 网 络 的 物理 构成 和 网 络 运行 的 协议 ， 那 么 可 以 进入 全 球 通信 基础 设施 的 领域 。 
下 面 的 部 分 将 介绍 有 关 构 建 一 个 数字 管道 网 络 的 概念 和 问题 ， 数 字 管 道 是 一 种 数据 、 音 频 和 视频 共享 
的 网 络 。 只 是 在 过 去 的 10 年 中 ， 集 成 不 同类 型 的 信息 流 才 变 得 有 可 能 实现 ， 而 且 这 种 集成 的 工作 仍然 
在 不 断 地 改进 完善 之 中 ， 成 功 实现 还 有 一 段 时 间 。 


11.7.1 数字 分 层 体系 


铺设 大 型 数字 管道 的 概念 是 由 拨号 语音 服务 提供 商 提 出 的 。 直 到 20 世纪 60 年 代 末 期 电话 服务 
通常 在 其 系统 中 都 使 用 模拟 信号 。 高 容量 的 模拟 线路 〈 主 干线 或 中 继 线 ，trunk line) 连接 到 全 球 各 个 
城市 的 长 途 电话 中 心 。 中 继 线 使 用 一 种 被 称 为 频 分 多 路 复 用 〈frequence division multiplexing，FDM) 
的 技术 ， 在 一 对 双 绞 线 上 可 以 同时 传输 多 个 通话 。FDM 类 似 于 收音 机 接收 器 。 我 们 可 以 通过 旋转 调谐 
刻度 盘 来 选择 收听 任何 一 个 广播 电台 。 所 有 的 这 些 信号 都 可 以 共享 同一 种 通信 介质 ， 因 为 它们 存在 不 
同 的 频率 。 当 FDM 用 于 长 途 电话 电缆 时 ， 每 对 话 路 都 被 分 配 自己 的 频带 ， 允 许 一 打 或 更 多 的 话 路 在 
同一 根 导体 上 进行 传输 而 不 会 引起 相互 干涉 。 

使 用 模拟 系统 ， 会 存在 一 些 问 题 ， 其 中 一 个 就 是 衰减 问题 。 为 了 防止 信号 在 长 距离 传输 时 衰减 消 
失 ， 沿 着 线路 每 隔 几 英里 就 需要 安放 一 个 模拟 放大 器 。 模 拟 放 大 器 可 以 增强 语音 信和 号， 同时 也 放大 了 
从 外 面 进入 到 线路 中 的 各 种 干扰 信号 和 背景 噪声 。 结 果 造 成 了 通话 的 质量 比较 善 ， 超 远 距 离 连 接 时 还 
伴随 有 恼人 的 静电 脏 哺 声 。 

在 20 世纪 60 年 代 ，Bell 系统 公司 开始 把 中 继 线 从 模拟 信和 号 转换 为 数字 信号 。 在 这 里 不 绸 使 用 放 
大 器 来 增强 信号 ， 数 字 载 波 使 用 转发 器 再 生 信 和 号。 转发 器 不 仅 比 放 大 器 便宜 很 多 和 更 加 可 靠 ， 而 且 它 
们 只 是 再 生 有 用 的 线路 信和 号。 背景 噪声 不 是 有 用 信和 号 的 一 部 分 ， 所 以 背景 噪声 不 会 被 再 生 和 沿 着 线路 
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传播 下 去 。 当 然 ， 由 于 人 类 语音 是 一 个 模拟 信号 ， 因 此 在 将 它 加 载 到 数字 载波 上 进行 传送 之 前 一 定 要 
转化 为 数字 信号 。 这 种 模拟 信号 到 数字 信号 的 转换 技术 称 为 脉 码 调制 pulse-code modulation,，PCM)。 

PCM 依赖 于 这 样 一 个 事实 ， 正 常人 的 声音 所 产生 的 最 高 频率 大 约 是 4000Hz。 因 此 ， 如 果 对 一 个 
电话 会 话语 音 每 秒 钟 采样 8000 次 ， 那 么 语音 的 振幅 和 频率 能 够 准确 地 以 数字 形式 表现 出 来 。 这 个 思想 
可 以 用 图 11-25 说 明 。 图 11-25a 说 明了 使 用 均匀 间距 (水 平 ) 量化 〈quantization) 电 平 的 脉冲 幅度 调 
制 。 每 个 量化 电 平 都 可 以 使 用 二 进 制 值 来 进行 编码 。 在 4000Hz 宽带 高 端 和 低 端 ， 这 种 调制 结构 的 每 
一 位 都 传输 同样 多 的 信息 。 然 而 ， 由 人 的 声音 所 产生 的 信息 和 由 人 的 耳 人 打 所 探听 的 信息 都 不 是 均匀 分 
割 的 。 而 是 在 宽带 的 中 间 位 置 聚集 成 束 。 因 为 这 个 原因 ， 如 果 PCM 的 量化 电 平 在 宽带 的 中 间 部 位 也 形 
成 类 似 的 聚集 束 ， 那 么 就 可 以 实现 人 声音 的 高 保 真 表现 ， 如 图 11-25b 所 示 。 因 此 ，PCM 载波 的 信息 
在 某 种 意义 上 反映 了 它 是 如 何 产生 和 解释 的 。 





a) 脉冲 幅度 调制 b) 脉 码 调制 
图 11-25 

经 过 主观 测试 ，BellCore (贝尔 系统 公司 的 工程 单位 ， 现 在 叫做 Telcordia) 的 工程 师 发 现 ， 当 他 们 
使 用 127 量化 电 平 时 ， 不 能 区 分 脉 码 调制 信号 和 一 个 纯 的 模拟 信号 。 因 此 ， 每 次 取样 只 能 用 7 位 二 进 制 
数 来 传输 信号 的 振幅 。 在 最 早期 的 PCM 配置 中 ，BellCore 为 了 发 送信 号 和 控制 目的 ， 将 第 8 位 二 进 制 数 
添加 到 PCM 取样 中 。 现 在 ， 全 部 8 位 都 被 使 用 。 通 过 一 个 语音 连接 所 产生 的 单 串 PCM 信号 需要 有 一 个 
64Kb/s (8 位 X8000 次 取样 / 秒 ) 的 带宽 。 数 字 信号 0 (DS-0) 是 64Kb/s PCM 二 进 制 位 串 的 信号 比率 。 

为 了 形成 一 个 传输 帧 ， 来 自 于 24 种 不 同 语音 连接 的 一 系列 PCM 信和 号 都 被 放置 到 线路 中 ， 利 用 控 





l25ps 
(193 位 ) 


11-26 时 分 复 用 
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制 信道 和 帧 位 形成 125ps 传输 帧 ， 如 图 11-26 所 示 。 因 为 每 个 连接 大 约 取得 125ps 帧 的 1/24， 所 以 这 
个 过 程 被 称 为 时 分 复 用 (time division multiplexing，TDM)。 对 于 每 个 连接 每 秒 钟 取样 8000 次 ， 这 种 
语音 信道 、 信 号 信道 和 帧 位 的 组 合 要 求 总 的 带宽 为 1. 544Mb/s。 

1. 544Mb/s 和 2. 048Mb/s 的 线路 速度 传输 速度 ) 分 别 叫做 T-l1 和 E-1， 并 且 它 们 传输 的 是 DS-1 
信和 号。 正如 可 以 对 24 路 和 32 路 电话 会 话 进行 复 用 形成 一 个 传输 帧 一 样 ， 这 些 帧 本 身 也 可 以 被 复 用 到 
一 个 高 速 的 链 路 上 实现 多 路 传输 。 图 11-27 表示 一 个 低速 从 属 线路 如 何 复 用 到 高 速 的 主干 中 继 线路 上 。 
这 组 载波 速率 是 由 准 同步 数字 体系 (Plesiochronous Digital Hierarchy，PDH) 的 复 用 层 所 产生 的 。 这 
个 体系 之 所 以 叫做 准 同 步 〈 区 别 于 同步 )， 是 因为 每 个 网 络 元 件 〈 例 如 一 个 开关 或 复 用 器 ) 都 有 自己 的 








DS2 (6.312Mb/s) 


DS3 (44.736Mb/s) 


E2 (8.448Mb/s) 


E3 (34.368Mb/s) 


MUX= 多 路 复 用 器 
b) E 载波 体系 
图 11-27 准 同步 数字 体系 
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时 钟 ， 它 与 这 个 体系 中 在 它 层 次 之 上 的 时 钟 进行 周期 性 的 同步 。 在 载波 上 没有 设置 单独 定时 信号 ， 就 
如 同一 个 真正 的 同步 网 络 的 情况 一 样 。 这 个 系统 中 最 顶层 的 时 钟 非常 准确 ， 其 误差 漂移 可 以 忽略 不 计 。 
然而 ， 由 于 定时 交换 信号 要 通过 这 个 分 层 结构 进行 传播 ， 于 是 就 产生 了 误差 。 当 然 ， 越 深 的 层次 结构 ， 
在 到 达 底 层 之 前 信号 就 越 可 能 发 生 漂 移 或 滑动 。 

PDH 内 在 时 序 问题 的 最 终 解决 办 法 是 ， 网 络 中 的 所 有 元 件 都 使 用 一 个 单一 的 定时 信号 。 在 20 世纪 
80 年 代 ，BellCore 和 美国 国家 标准 化 组 织 (ANSID 制定 了 一 个 同步 光纤 网 的 标准 ，SONET。 这 个 标准 最 
终 变 成 了 北美 地 区 的 主要 光学 载波 系统 。 由 于 SONET 是 以 传输 帧 的 大 小 为 193 位 的 工 载波 构建 的 ， 而 
欧洲 的 通信 系统 使 用 的 是 一 个 256 位 的 帧 ， 所 以 SONET 的 系统 不 适合 在 欧洲 使 用 。 相 反 ， 欧 洲 把 SO- 
NET 应 用 于 下 载波 系统 ， 称 为 同步 数字 体系 (synchronous digital hierarchy，SDH) 。 正 如 工 载波 系统 的 
基本 信号 是 速率 为 1. 544Mbys 的 DS-1 一 样 ， 基 本 的 SONET 信号 是 速率 为 51. 84Mb/s 的 STS-1 (同步 传 
输 系 统 1，synchronous transport system 1) 。 当 STS 信和 号 通过 光 载 波 网 络 时 ， 这 个 信号 就 叫做 OCx， 其 中 
工 是 载波 速率 。 基 本 的 SDH 信号 是 STM-1， 它 传输 信号 的 速率 可 达 155. 52Mb/s。 表 11-2 列 出 了 光 载 波 
体系 SONET 和 SDH 的 对 比 。 使 用 工 载 波 系统 和 下 载波 系统 的 位 速率 要 低 于 图 中 给 出 的 数字 。 


表 11-2 北美 (SONET) 和 欧洲 (SDH) 光 载 波 系统 

















STS-1 51. 84 


STS-3 STM-1 OC-3 155. 52 
STS-9 STM-3 OC-9 466. 56 
STS-12 STM-4 OC-12 622. 08 
STS-18 STM-6 OC-18 933. 12 


STS-24 STM-8 OC-24 1244. 16 


STS-36 STM-12 OC-36 1866. 24 


STS-48 STM-16 OC-48 2488. 32 





STS-96 OC-96 4976. 64 





STS-192 





9953. 28 


对 于 长 距离 传输 而 言 ，T-3 和 E-3 帧 要 转换 成 OC-1 和 SDH-1 (和 更 高 级 别 ) 载波 。 然 而 ， 使 用 
SONET 或 SDH 可 以 不 需要 类 似 于 图 11-27 中 所 示 的 阶梯 分 层 结 构 。 从 理论 上 来 说 ， 如 果 有 需要 的 话 ， 
64 OC-3 载波 能 够 直接 被 复 用 到 OC-192 载波 上 。 这 样 做 可 以 使 网 络 的 管理 更 加 简单 ， 而 且 减 少 了 通过 
系统 的 延迟 时 间 。 

光 载 波 系统 非常 适用 于 作为 超 快 的 广域网 (WAN) 和 因特网 的 主干 网 络 的 载体 服务 。 这 个 问题 现 
在 已 经 变 成 了 如 何 将 高 容量 服务 提供 到 家 庭 和 小 型 商业 企业 。 电 话 线 的 “最 后 一 里 *”， 即 本 地 回路 
(local loop) ， 是 连接 中 继 局 及 其 客户 。 大 部 分 的 本 地 回路 都 是 使 用 低 宽带 的 铜 双 绞 线 ， 不 适用 于 兆 级 
的 数据 传输 。 但 是 随 着 各 个 地 区 的 电话 公司 不 断 对 现 有 线路 进行 升级 ， 以 及 一 些 参与 竞争 的 地 区 性 交 
换 承运 商 在 他 们 有 希望 获得 利润 的 地 区 采用 新 (光纤 ) 的 线路 ， 这 种 情况 正在 改善 之 中 。 


11.7.2 ISDN 


把 数字 通信 服务 直接 连接 到 家 庭 和 企业 的 概念 已 经 不 再 是 什么 新 名 词 了 。 这 个 概念 可 以 追溯 到 
数字 语音 传输 的 起 源 。 但 是 ， 在 30 多 年 前 这 种 思想 还 是 有 些 新 颖 超前 的 。1972 年 ，ITU-T 组 织 
(当时 称 为 'CCITT) 开始 从 事 一 系列 推广 活动 ， 推 广 一 种 全 数字 网 络 。 全 数字 网 络 可 以 把 音频 、 视 频 
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和 数据 直接 传送 给 用 户 。 这 种 网 络 具 有 一 个 通用 接口 ， 可 以 很 容易 地 连接 到 任何 一 个 有 合适 设备 的 
用 户 。 相 应 地 ， 这 种 网 络 被 称 为 综合 业务 数字 网 (Integrated Services Digital Network，ISDN)。 
1982 年 ,发表 了 这 个 系列 活动 的 第 一 份 建议 书 ， 在 随后 的 10 年 时 间 中 不 断 出 现 各 种 补充 和 改进 
的 版 本 。 

ISDN 是 严格 依照 ISO 参考 模型 来 设计 的 。ISDN 中 的 组 件 跨越 了 整个 的 7 层 模 型 ， 但 是 这 些 建议 
中 的 大 部 分 内 容 都 属于 第 1 层 到 第 3 层 的 范围 。 这 些 ISDN 建议 的 主要 内 容 集中 在 位 于 ISDN 模型 中 的 
某 些 特定 参考 点 的 不 同 网 络 终端 设备 和 接口 上 面 。 这 种 系统 的 组 织 结构 如 图 11-28 所 示 。 


ISDN 
Exchange 





图 11-28 ISDN 系统 的 组 织 结构 


网 络 终端 1 (Network Termination，NT-1) 是 一 种 完全 放置 于 用 户 前 面 的 网 络 终端 设备 。NT-1 
通过 本 型 接口 (终端 连接 到 数字 网 络 。NT-1 设备 可 以 支持 多 路 的 ISDN 信道 和 各 种 类 型 的 数字 设 
备 。 有 些 数字 设备 ， 例 如 报警 系统 ， 可 以 一 直 对 网 络 开放 〈 处 于 接 通 状态 ) 。 一 个 ISDN NT-1 设备 可 
以 直接 连接 多 达 8 个 设备 。 能 够 直接 连接 到 NT-1 设备 的 设备 叫做 TE-1， 即 第 1 种 类 型 的 终端 设备 
(Terminal Equipment Type-1)。 

不 能 够 直接 连接 到 NT-1 端口 的 设备 可 以 通过 一 个 ISDN 终端 适配器 (Terminal Adaptor，TA) 
接 人 数字 网 络 。 这 类 设备 被 称 为 第 2 种 类 型 的 终端 设备 (Terminal Equipment Type-1，TE-2), 在 TA 
和 TE-2 之 间 的 参考 点 被 称 为 R (速率 ) 参考 点 。TE-2 包括 了 所 有 的 不 能 直接 连接 到 数字 线路 上 的 设 
备 ， 例如 家 用 计算 机 必须 要 通过 一 个 调制 解 调 器 (Modem) 才能 连接 到 因特网 。 终 端 适配器 (TA) 要 
通过 S (系统 ) 参考 点 接 到 网 络 。 

网 络 终端 2 (Network Termination ，NT-2) 是 一 种 智能 型 的 ISDN 接口 ， 它 可 以 提供 从 第 1 层 到 
第 3 层 的 各 种 服务 。 要 求 高 比特 率 的 设备 ， 如 专用 的 自动 (电话 ) 交换 分 机 系统 和 局 域 网 CLAN)， 可 
以 直接 连接 到 一 个 ISDN 的 NT-2 端 日 。NT-2 设备 通过 工 参 考点 接 人 ISDN 网 络 。 从 实用 的 角度 来 看 ， 
S 接 口 与 工 接口 是 一 样 的 ， 所 以 有 时 称 为 S/T 接口 (S/T interface) 。NT-2 设备 称 为 信道 服务 单元 / 数 
据 服务 单元 (Channel Service Unit/Data Service Units，CSU/DSUs) 。 

一 个 ISDN 的 本 地 回路 服务 通过 U 〈 用 户 ) 参考 点 连接 到 ISDN 交换 局 。ISDN 交换 局 包含 与 模拟 
电话 设备 不 同 的 数字 交换 机 设备 ， 而 且 它 们 之 间 是 完全 隔离 开 来 的 。 模 拟 电 话 系统 会 基于 一 种 带 内 
(in-band) 信和 号 在 呼叫 双方 之 间 建 立 和 中 断交 换 电 路 。 换 言 之 ， 当 使 用 模拟 电话 呼叫 时 ， 系 统 会 使 用 和 
传送 声音 时 相同 的 传输 频率 对 路 由 信息 (呼叫 站 点 的 编号 ) 进行 编码 。 特 定 频率 的 各 种 声调 ， 或 者 是 
通过 拨号 方法 产生 的 脉冲 信号 也 都 可 以 编码 成 路 由 信息 。 但 是 ，ISDN 是 使 用 独立 的 信号 信道 来 输送 这 





378 第 11 沈 





些 信息 的 ， 这 些 独 立 的 信号 信道 与 ISDN 帧 的 数据 信道 多 路 复 用 。 

ISDN 支持 两 种 信号 速率 结构 ,基本 (basic) 速率 和 主要 (primary) 速率 。 使 用 基本 速率 和 主要 
速率 的 线路 连接 分 别称 为 基本 还 率 接口 (Basic Rate Interface，BRI) 和 主要 速率 接口 (Primary Rate 
Interface，PRI)。 基 本 速率 接口 由 两 个 速率 为 64Kb/s 的 也 信道 (B-Channel) 和 一 个 速率 为 16Kbys 的 
DD 信道 (D-Channel) 组 成 。 这 些 信道 完全 占据 了 一 个 1 帧 的 两 个 信道 再 加 上 第 3 个 信道 的 四 分 之 
一 ， 如 图 11-29 所 示 。ISDN 的 主要 速率 接口 占据 了 整个 工 : 帧 ， 可 以 提供 23 个 速率 为 64Kb/s 的 BB 信 
道 和 整个 64Kb/s 的 DD 信道 。 可 以 对 B 信道 进 行 多 路 复 用 ， 提 供 较 高 速 数 据 速率 ， 例 如 速率 为 128Kb/s 
的 住宅 区 网 络 服务 。 


| 一 一 一 一 一 一 = 信道 每 个 信道 占 1 他 区 一 一 一 一 一 一 一 | 






帧 位 
193 位 Tl 帧 一 一 一 一 一 一 一 | 
| 一 一 一 一“ 信道 (每 个 信道 占 1 1 


信道 1 


| 一 -一 -一 一 一 一 一 256 位 El 帧 


图 11-29 基本 速率 和 主要 速率 的 ISDN 信道 


DD 信道 可 以 对 在 B 信道 上 的 通信 传输 提供 各 种 信号 和 网 络 管理 服务 。 通 过 使 用 一 种 被 称 为 系统 信 
号 传输 7 (System Signal 7，SS7) 的 协议 可 以 实现 这 种 信道 之 间 的 连接 管理 ，SS7 已 经 超出 了 本 课程 
的 范围 (读者 可 以 参考 本 章 结 尾 处 的 参考 文献 )。 

不 幸 的 是 ，ISDPN 委员 会 在 发 布 建议 书 时 ， 既 没有 足够 的 远见 ， 也 没有 做 出 迅速 的 反应 。 几 乎 过 
了 20 年 ， 才 把 第 一 个 ISDN 产品 推 向 市 场 ， 而 这 时 企业 和 用 户 所 需求 的 带宽 已 经 远 远 超出 了 ISDN 
所 传输 的 能 力 范 围 。ISDN 为 语音 提供 太 多 的 带宽 ， 而 为 数据 提供 的 带宽 却 非常 少 。 因 此 ， 除 了 相对 
少数 的 家 庭 网 络 用 户 之 外 ，ISDN 实际 上 已 经 变 成 了 技术 上 的 孤儿 。 但 是 ，ISDN 的 重要 性 在 于 : 它 
构成 了 连接 一 种 更 先进 的 称 为 异步 传输 模式 (Asynchronous Transfer Mode，ATM) 的 通用 数字 系统 
的 桥梁 。 


11.7. 3 异步 传输 模式 


通常 使 用 在 语音 通信 中 的 传统 的 时 分 复 用 技术 ， 并 不 能 充分 利用 网 络 的 传输 带宽 。 当 两 个 人 在 进 
行 ( 有 礼貌 的 ) 对 话 时 ， 其 中 一 方 会 在 另 一 方 开始 说 话 之 前 暂停 1 秒 或 2 秒 时 间 。 在 这 2 秒 期 间或 者 
说 是 这 段 “ 寂 静 的 空气 (dead air)” 时 间 ， 可 能 会 有 16000 个 空 的 信道 时 间 段 沿 着 这 条 线路 传送 。 由 
于 采用 的 是 时 分 复 用 技术 ， 所 以 这 个 宽带 将 会 被 浪费 ， 原 因 是 整个 信道 都 要 为 这 个 呼叫 需要 的 持续 时 
间 而 保留 起 来 ， 而 不 管 信道 是 否 在 传递 有 用 的 信息 。 

如 果 能 够 截取 这 些 空 的 信道 时 间 段 ， 那 么 这 些 空 时间 段 就 可 以 用 来 传输 数据 ， 甚 至 可 以 进行 另 一 
个 对 话 。 然 而 ， 要 实现 这 一 点 ， 我 们 必须 将 每 个 信道 拆 分 成 一 些 独立 的 单元 ， 并 御 底 放弃 采用 24 个 轩 
定 的 位 信道 占据 一 个 固定 的 125us 信道 帧 的 思想 。 这 就 是 异步 传输 模式 的 关键 思想 。 每 个 对 话 和 每 个 
数据 的 传输 都 由 一 系列 离散 的 大 小 为 53 个 字 节 的 单元 (cell) 组 成 ,我们 可 以 对 这 些 单元 进行 独自 管 
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理 和 路 由 传输 ， 最 佳 地 利用 只 要 是 可 用 的 带宽 。 

正如 上 面 所 述 ，CCITT 最 终 在 1988 年 完成 了 ISDN 的 规范 ， 实 际 上 所 有 的 成 员 都 知道 ， 这 种 技术 
在 它 使 用 之 前 就 已 经 陈旧 过 时 了 。 与 此 同时 ， 人 们 立即 开始 了 构思 设计 下 一 代 的 高 速 数字 载体 的 工作 。 
CCITT 意识 到 通信 的 未 来 在 于 能 够 将 语音 、 数 据 和 实时 视频 的 信息 传输 集成 到 某 个 单一 的 载体 服务 
中 。 这 些 不 同类 型 的 服务 至 少 要 求 有 150Mb/s 的 传输 带宽 ， 这 远 远 超过 了 CCITT 所 制定 的 ISDN 规范 
的 容量 范围 。 于 是 ，CCITT 决定 把 下 一 代 的 数字 服务 称 为 宽带 ISDN (broadband ISDN，B-ISDN), 用 
来 区 别 于 已 经 被 取代 的 传统 的 《〈 窗 带 ) ISDN。 

在 设计 上 ， 宽 带 ISDN 要 向 下 兼容 ISDN。 实 际 上 ， 宽 带 ISDN 使 用 同一 个 参考 模型 ， 如 图 11-30 
所 示 。 蜡 步 传输 模式 (ATM) 是 实现 B-ISDN 的 首选 体系 结构 。 异 步 传输 模式 可 以 直接 支持 3 种 传输 
服务 模式 : 速率 为 155. 52Mb/s 的 全 双 工 通信 和 模式， 速率 为 622. 08Mb/s 的 全 双 工 通信 模式 ， 和 一 种 异 
步 模式 。 这 种 异步 传输 模式 的 上 传 速率 〈 传 到 网 络 上 ) 为 155. 52Mb/s 和 下 传 速率 (从 网 络 传 出 ) 为 
622. 08Mby/s。 


ATM 网 络 





图 11-30 ”宽带 ISDN 的 参考 模型 

异步 传输 模式 CATM) 可 以 在 53 字 节 单元 的 有 效 载荷 中 携带 数据 、 音 频 或 视频 的 传输 信息 。 这 
些小 的 单元 〈 或 物理 协议 数据 单元 ，PDU) 允许 使 用 相对 简单 的 硬件 设备 来 处 理 交 换 和 路 由 事宜 。 通 
过 使 用 虚拟 路 径 ， 可 以 简化 数据 单元 的 路 由 路 径 。 虚 拟 路 径 是 在 单个 易于 管理 的 数据 流 中 上 接 人 几 个 
虚拟 的 连接 。 实 际 上 ， 任 何 一 种 介质 : 双 绞 线 、 同 轴 电 缆 或 光纤 ， 都 能 够 支持 速度 范围 在 44. 736Mb/s 
和 155Mb/s 之 间 的 ATM 信和 号。 

最 初 ，ITU-T 并 没有 看 到 ATM 有 任何 优势 ， 认 为 它 不 过 是 一 个 宽 区 域 载体 服务 。 但 是 ， 实 际 上 
ATM 适用 于 任何 较 高 层次 的 协议 。ATM 能 够 以 不 同 的 速度 传输 各 种 不 同 的 协议 。 由 于 这 些 原因 ， 
ATM 论坛 (网络 设备 供应 商 的 一 个 协会 )， 从 20 世纪 90 年 代 初 ， 就 一 直 致 力 于 把 ATM 推广 应 用 到 
私营 的 网 络 。ATM 极 有 可 能 成 为 一 个 伟大 的 统一 者 ， 为 各 种 型 号 和 不 同 速度 的 网 络 提供 一 种 单一 的 
网 络 连 接 技术 ,包括 LAN、MAN 和 WAN。 但 是 ， 在 普及 ATM 技术 之 前 ， 它 的 安装 费用 必须 大 幅度 
地 降低 ， 才 能 够 与 当前 的 网 络 技术 相 竞 争 。 当 在 同一 个 介质 上 传输 数据 、 音 频 和 视频 的 价值 得 到 体现 
时 ，ATM 作为 一 种 唯一 的 高 比特 率 的 长 距离 网 络 技术 将 占 统治 地 位 。 
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11.8 因特网 的 概况 


第 11. 3 节 介 绍 了 因特网 如 何 从 开始 时 期 的 一 个 封闭 的 军用 研究 网 络 演变 为 今天 的 全 球 通信 的 基础 
设施 。 但 是 ， 不幸 地 ,访问 因特网 并 不 是 像 使 用 拨号 语音 电话 那样 的 简单 。 大 多 数 个 人 和 企业 用 户 都 
要 通过 私营 的 网 络 服 务 提 供 商 (internet service providers，ISP) 才能 连接 到 因特网 。 每 个 网 络 服 务 提 
供 商 都 拥有 一 个 交换 中 心 ， 称 为 网 络 接 入 网 点 〈point-of-presence，POP)。 许 多 网 络 服务 提供 商都 有 
一 个 以 上 的 POP。 因 特 网 的 用 户 通 常 可 以 通过 域名 来 知道 这 些 POP，POP 的 域名 一 般 都 是 以 . com、 
. net，. biz 或 者 是 以 类 似 . uk、. de 这 样 的 国家 代码 结束 的 。 有 些 POP 通过 高 速 线路 〈T-1 或 更 高 ) 连 
接 到 一 些 区 域 性 的 POP 或 其 他 主要 中 介 POP。 大 体 上 说 ， 从 底 端 到 顶端 (bottom-to-top) 的 连接 分 
层 结构 是 终端 (PC 机 和 工作 站 ) 连接 到 本 地 的 ISP， 然 后 连接 到 区 域 性 的 ISP， 最 后 连接 到 国家 和 国 
际 性 的 ISP (通常 称 作 国家 主干 网 络 提 供 商 ，National Backbone Providers，NBP) 。 这 个 体系 结构 很 容 
易 添 加 新 的 分 支 ， 就 像 很 方便 地 增加 新 的 层次 一 样 。NBP 本 身 也 必须 相互 连接 在 一 起 ， 这 种 NBP 的 
连接 是 通过 网 络 访 问 点 (network access points，NAP) 来 实现 的 ，NAP 是 一 些 区 域 性 的 ISP 之 间 相 
互 连 接 所 使 用 的 一 种 特殊 的 交换 中 心 。 在 美国 ， 一 些 当地 的 POP 把 它们 的 分 支 信息 传输 主要 集中 到 
T-3 或 OC-12 线路 上 ， 这 些 线路 再 与 某 个 NAP 相连 接 。 这 种 ISP-POP-NAP 的 分 层 体系 结构 如 图 
11-31 所 示 。 每 个 ISP 和 POP 都 是 根据 通过 NAP 的 连接 线路 上 的 信息 量 来 支付 其 网 络 使 用 费 。 信 息 
量 越 大 ， 每 个 用 户 支付 的 费用 也 就 越 多 。 很 多 的 网 络 收入 又 被 投资 到 网 络 设备 上 ， 以 维持 更 好 的 因 
特 网 客户 服务 。 


ISP 本 地 /区 域 网 络 接 入 点 





ISP 本 地 / 区域 网 络 接 入 点 
图 11-31 因特网 的 分 层 结构 


11.8.1 走 进 因特网 


一 些 主要 的 因特网 用 户 ， 例 如 大 公司 、 政 府 机 关 和 学 术 机 构 ， 有 能 力 承担 租用 位 于 用 户 和 ISP 之 间 的 
直接 高 容量 数字 线路 的 费用 。 但 是 ， 这 些 线路 租用 的 费用 远 远 超 出 了 个 人 和 人 小 型 企业 所 能 承受 的 范围 。 这 样 
一 来 ， 需 要 中 等 带宽 的 网 络 用 户 通常 使 用 标准 电话 线 来 满足 他 们 的 通信 需求 。 因 为 标准 电话 线 只 能 够 传输 模 
拟 〈 语 音 ) 信号 ， 所 以 利用 电话 线 传输 计算 机 产生 的 数字 信号 之 前 ， 首 先 必须 进行 信号 转换 ， 或 称 为 调制 
(modulated) ， 将 数字 信号 转换 成 模拟 信号 。 在 接收 端 ， 这 些 信号 又 必须 被 解 调 〈demodulated) ， 从 模拟 信和 号 
转换 回 数字 信号 。 这 种 信号 转换 设备 称 之 为 调制 器 / 解 调 器 ， 或 简称 调制 解 调 器 (modem) 。 大 多 数 的 家 
用 计算 机 都 配 有 内 置 的 调制 解 调 器 。 这 些 调 制 解 调 器 直接 连接 到 IO 系统 总 线 。 
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传 绿 拨号 线路 和 凋 制 解 调 器 
音频 波段 的 电话 线路 能 够 传输 信号 的 频率 范围 是 ，300~3300Hz， 传 输 线路 的 总 带宽 为 3000Hz。1924 
年 ， 信 息 理 论 学 家 奈奈 斯 特 证 明了 没有 信和 号 能 够 以 比 其 频率 快 2 倍 的 速率 传输 信息 。 用 公式 表示 如 下 : 
最 大 数据 传输 率 = 2 X (带宽 ) X logz (信和 号 电 平 数 ) 波 特 
其 中 ， 波 特 是 线路 的 信号 发 送 速度 。 
因此 ， 从 数学 上 来 说 ，3000Hz 的 信号 能 够 传输 的 二 进 制 数据 的 最 高 传输 速率 为 6000 波 特 。 
1984 年 ， 香 农 扩展 了 奈 夺 斯 特 的 理论 ， 考 虑 线路 中 存在 噪声 的 情况 ， 公 式 中 使 用 线路 的 信 叶 此 
(signal-to-noise ratio) 。 结 果 表 示 为 : 


最 大 数据 传输 率 一 带宽 xlogz (1 十 个 这 )b/s 


公用 交换 电话 网 (public switched telephone network，PSTN) 的 典型 信 噪 比 为 30dB。 根 据 香农 的 
结果 ,语音 波段 的 电话 线路 的 最 大 数据 传输 率 近 似 等 于 30 000b/s， 而 不 考虑 所 使 用 信和 号 电 平 的 数目 。 
有 些 调制 解 调 器 使 用 的 数据 压缩 技术 可 以 将 吞吐 量 提 升 到 56Kb/s， 但 是 压缩 数据 的 传输 速率 仍然 不 能 
够 超过 30Kb/s。 具 有 讽刺 意味 的 是 ， 因 为 大 多 数 调 制 解 调 器 使 用 的 是 从 Ziv-Lempel 算法 衍生 出 来 的 
ITU-T v42. bis 的 压缩 标准 ， 所 以 当 利用 这 类 Modem 下 载 一 个 已 经 压缩 的 文件 时 ， 例 如 JPEG、GIF 
或 ZIP 文件， 吞吐 量 会 显著 地 下 降 。 回 顾 一 下 第 7 章 的 内 容 ， 如 果 信 息 中 包含 的 元 余 不 足够 时 ， 基 于 
字典 的 压缩 方案 实际 上 会 导致 压缩 后 的 文件 被 扩大 ， 就 如 同文 件 已 经 被 压缩 的 情况 一 样 。 

调制 (modulating〉 一 个 数字 信号 到 模拟 载体 上 ， 就 意味 着 需要 改变 这 个 模拟 载体 的 某 些 特性 ， 
这 样 模拟 信号 才 可 以 传输 数字 信息 。 改 变 振 幅 、 改 变频 率 或 者 改变 信和 号 的 相位 都 能 够 产生 一 个 数字 信 
号 的 模拟 调制 。 这 些 调 制 的 形式 如 图 11-32 所 示 。 图 11-32a 表示 一 个 没有 调制 的 载波 信和 号， 频率 不 能 
超过 3000Hz。 图 11-32b 表示 的 是 使 用 信号 振幅 变化 方式 (幅度 调制 ) 进行 调制 后 的 同一 个 载波 ， 载 
波 传输 的 是 ASCI 编码 字符 “K”。 图 11-32c 和 图 11-32d 分 别 表 使 用 频率 调制 和 相位 变化 调制 方式 进 
行 调 制 后 的 同一 个 位 组 合 模式 。 在 图 11-32d 中 ， 通 过 信和 号 的 相 移 180 度 来 区 分 二 进 制 信号 的 1 和 0。 
这 种 调制 方法 有 时 也 称 为 相 移 键 控 (phase shift keying) 。 


1 周期 
(Hz) 
BA 
| 1 | | | | 
1 1 1 I | 1 1 I | 
a) RAPEPc- 
| | 


图 11-32 a) 一 个 简单 的 载波 信号 
b) 字母 “K” 的 载波 的 幅度 调制 
c) 字母 “K” 的 频率 调制 
d) 使 用 180 度 相位 变化 的 相位 变化 调制 
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从 实用 的 角度 出 发 ， 使 用 简单 的 振幅 调制 、 频 率 调制 或 相位 变化 调制 方法 最 大 的 吞吐 量 大 约 
为 2400b/s。 为 了 突破 这 个 限制 ， 调 制 解 调 器 的 设计 者 们 每 次 改变 信号 的 两 个 特性 而 不 只 是 改变 
一 个 特性 。 其 中 一 种 调制 方法 称 为 正 交 幅 度 调制 (quadrature amplitude modulation，QAM) ， 同 时 
改变 载波 信号 的 相位 和 振幅 。QAM 使 用 彼此 之 间 相 位 相差 180 度 的 两 个 载波 信和 号。 读者 可 以 认 
为 这 两 个 信号 的 其 中 一 个 是 正弦 波 ， 而 另 一 个 是 余弦 波 。 利 用 X，Y 坐标 平面 来 描述 编码 的 指定 
的 位 组 合 模式 的 信号 点 (signal point) 。 因 此 ， 对 于 立 坐 标 调制 正弦 波 ， 对 于 X 坐 标 调制 余弦 波 。 
将 正弦 波 和 余弦 波 理 加 在 一 起 就 产生 一 个 单一 的 模拟 波 ， 这 种 信和 号 可 以 非常 方便 地 沿 着 线路 进行 

通过 调制 正弦 波 和 余弦 波 在 笛 卡 儿 坐 标 平面 上 描述 的 信号 点 的 集合 称 为 信号 星座 图 〈signal con- 
stellation) 或 信号 点 阵 (signal lattice) 。 利 用 平面 上 的 每 个 点 阵 点 都 可 以 对 几 个 二 进 制 的 位 进行 编码 。 
图 11-33a 表示 每 波 特 上 有 一 个 3 位 的 虚构 编码 。 在 这 里 ， 相 位 变化 90 度 ， 或 者 信号 幅度 的 一 个 变化 就 
可 以 从 一 种 位 组 合 模 式 变 成 另 一 种 位 组 合 模式 。 调 制 解 调 器 的 速度 越 快 ， 每 波 特 传输 的 位 就 越 多 ， 而 
信号 星座 图 也 就 变 得 越 密 。 图 11-33b 表示 一 个 使 用 格 码 调制 trellis code modulation，TCM) 技术 的 
调制 解 调 器 的 信号 点 阵 图 。TCM 与 QAM 非常 类 似 , 但 是 TCM 在 每 个 信号 点 增加 了 一 个 奇偶 位 ， 允 
许 在 传输 信号 中 进行 向 前 纠 错 。 





a) 正 交 幅度 调制 、 b) 格 码 调制 
图 11-33 正 交 幅度 和 格 码 调制 

调制 《和解 调 ) 一 个 数字 信和 号 只 是 调制 解 调 器 的 一 部 分 工作 。 调 制 解 调 器 是 连接 计算 机 主机 的 二 
进 制 与 公用 电话 线路 的 模拟 世界 的 一 座 桥梁 。 调 制 解 调 器 通过 与 主机 系统 以 及 线路 男 一 端的 调制 解 调 
器 进行 协议 交换 来 控制 连接 。 因 为 从 本 质 上 来 说 信号 流 只 有 一 个 通道 ， 所 以 模拟 传输 必须 是 串 行 的 、 
异步 的 传输 。 最 老 和 最 持久 的 串 行 协议 是 IEEE RS-232-C 标准 。 另 外 ， 还 有 其 他 标准 ， 例 如 EIA 
232-D、RS-449、EIA530、ITU-T V24 和 V28 协议 。 所 有 的 协议 都 由 他 们 相应 的 标准 化 组 织 在 官方 出 
版 的 文献 中 进行 了 详细 的 介绍 ， 但 是 异步 串 行 通信 的 基本 思想 ， 自 从 1969 年 RS-232-C 标准 首次 发 布 
以 来 就 一 直 没 有 改变 过 。 

从 正式 标准 来 说 ，RS-232-C 是 由 一 个 标准 的 25 针 的 “D” 型 连接 器 上 命名 为 24 根 线 路 组 成 。 调 
制 解 调 器 在 调制 信号 到 达 传 输 介质 之 前 ， 会 控制 主机 与 调制 解 调 器 之 间 的 数据 流 。 在 标准 的 文献 中 ， 
将 调制 解 调 器 称 作 为 数据 通信 设备 〈data communications equipment，DCE) ， 计 算 机 主机 被 称 为 数据 
终端 设备 〈data terminal equipment，DTE)。 这 两 个 名 称 反 映 了 编写 原始 标准 的 技术 时 代 。 在 
RS-232-C 标 准 中 定义 的 24 根 线路 中 ， 只 有 其 中 的 8 根 是 大 多 数 串 行 通信 中 所 必须 的 。 因 此 ， 一 些 国外 
的 调制 解 调 器 的 制造 商 在 调制 解 调 器 和 主机 系统 之 间 使 用 一 个 9 针 的 “D” 连 接 器 。25 针 和 9 针 连 接 
器 的 插脚 引线 如 表 11-3 所 示 。 
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表 11-3 IEEE RS-232-C 串 行 连接 器 的 插脚 引线 和 线路 说 明 










一 wa | 
CE 








载波 探测 (CD) 


[| ET 
EEC 


要 进行 一 个 对 外 呼叫 调制解调器 首先 要 接 通 线路 〈 就 如 同 拿 起 电话 )， 并 且 听 到 一 个 拨号 音 。 如 果 
线路 已 经 连通 ， 则 调制 解 调 器 会 发 送 其 载波 检测 信号 〈Carrier Detect，CD) 。 收 到 这 个 CD 信和 号 后 ， 主 机 
会 提供 要 拨号 连接 的 号 码 ， 而 调制 解 调 器 会 将 拨号 信号 放 到 线路 上 ， 通 常 这 个 信号 是 以 拨号 音 的 形式 存 
在 的 。 如 果 接 收 端的 调制 解 调 器 使 用 正确 的 应 答 音 调 回复 了 这 个 呼叫 ， 那 么 两 个 调制 解 调 器 都 将 发 送 它 
们 的 数据 设备 就 绪 信 号 (Data Set Ready，DSR)。 一 旦 启动 的 DTE 发 现 DSR 信号 ， 则 它 就 会 发 送 一 个 准 
备 发 送信 号 (Ready To Send，RTS)。 当 调制 解 调 器 注意 到 主机 已 经 发 送 了 RTS 信号 时 ， 它 将 会 发 送 清 
除 发 送 (Clear To Send，CTS) 和 数据 载波 检测 (Data Carrier Detect，DCD) 信号 做 出 应 答 。 

在 整个 数据 传输 会 话 过 程 中 ， 当 数据 填 满 缓冲 器 和 较 高 层 的 协议 执行 误差 检测 与 检查 点 程序 时 ， 
RTS、CTS 和 DSR 信 和 号 可 能 会 被 升 起 和 降低 。 一 旦 这 个 对 话 过 程 完 成 ， 启 动 的 主机 就 会 关闭 其 RTS 和 
cTS 信号 ， 造 成 调制 解 调 器 在 线路 上 呈现 “ 挂 起 ”的 状态 。 当 另 一 端的 调制 解 调 器 注意 到 连接 已 经 被 
终止 时 ， 它 就 会 断 开 载波 连接 ， 并 降低 其 DcD 信 号 让 其 主机 知道 这 个 会 话 过 程 已 经 被 终止 了 。 

RS-232-C 连接 可 以 用 于 许多 不 同 种 类 的 低速 数据 传输 。 在 微型 计算 机 的 早期 实际 上 所 有 的 打印 
机 都 是 串 行 连接 到 主机 系统 ， 并 且 都 是 RS-232-C 连接 。 其 至 今天 ， 有 时 人 们 还 用 零 调制 解 调 器 (null 
modem) 来 从 一 个 系统 到 另 一 个 系统 转移 文件 。 零 ( 空 ) 调制 解 调 器 只 有 一 对 9 针 或 25 针 的 电缆 连接 
器 ， 如 表 11-4 所 示 。 使 用 这 种 配置 结构 ， 两 个 系统 都 会 被 以 为 在 它们 之 间 存 在 有 一 个 调制 解 调 器 ， 而 
实际 上 并 没有 调制 解 调 器 。 利 用 这 种 方式 ， 两 台 计 算 机 之 间 可 以 交换 大 量 的 信息 ， 而 无 需 使 用 磁盘 、 
磁带 或 者 网 络 资源 。 








表 11-4 ”Null modem 插脚 引线 
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尽管 许多 家 用 计算 机 都 配备 了 内 置 调制 解 调 器 ， 但 是 网 络 服务 提供 商 和 其 他 数据 服务 公司 仍 有 大 
量 的 拨号 上 网 的 用 户 ， 通 常 这 些 用 户 使 用 的 是 由 几 十 个 、 甚 至 上 百 个 调制 解 调 器 组 成 的 调制 解 调 器 库 。 
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这 种 调制 解 调 器 库 配 备 多 根 人 站 线路 。 如 果菜 根 特 定 的 线路 忙 ， 那 么 网 络 连 接 就 会 从 一 根 人 站 线路 
“滚动 (rolD)” 到 下 一 个 人 站 线路 ， 直 到 找到 一 个 空闲 线路 。 这 种 连接 转换 的 发 生 不 需要 呼叫 者 的 应 答 
或 积极 参与 。 只 有 当 所 有 的 人 站 线路 都 忙 的 时 候 ， 才 会 发 送 忙 信号 。 





香农 定律 对 模拟 电话 调制 解 调 器 的 限制 速率 为 30Kb/s， 这 种 限制 使 得 要 承诺 无 边界 的 网 络 世 界 对 
任何 一 个 销售 商都 开放 会 遭遇 到 一 个 重大 障碍 。 近 几 十 年 来 ， 虽 然 长 途 电话 链接 已 经 变 得 快速 和 数字 
化 ， 但 是 从 电话 交换 中 心 到 用 户 之 间 的 本 地 回路 连接 电路 仍然 继续 使 用 着 上 百年 老式 的 模拟 技术 。 事 
实 上 ,“ 最 后 一 里 ”的 本 地 回路 所 跨越 的 距离 非常 长 ， 要 将 从 前 的 模拟 电话 服务 带 人 到 当今 的 数字 世界 
的 代价 是 极其 昂贵 的 。 

幸运 地 ， 电 话 线 中 的 物理 导体 有 足够 厚 ， 可 以 支持 几 英 里 的 中 速 数字 信息 传输 ， 而 不 会 产生 太 大 
的 衰减 。 意 识 到 这 一 点 ， 通 信和 集团 已 经 开发 一 些 技 术 ， 为 住宅 用 户 和 小 型 企业 提供 比较 廉价 的 数字 服 
务 。 数 字 用 户 线路 〈Digital Subsriber Line，DSL) 就 是 这 样 的 一 种 技术 ， 它 能 够 与 简易 老式 电话 业务 
(plain old telephone service，POTS) 共存 ， 利 用 同一 根 双 绞 线 传 送 数 字 信息 。 目 前 ， 大 多 数 DSL 服务 
只 适用 于 到 中 央 电 话 交 换 局 〈CO) 的 连接 铜 线 少 于 18000 英尺 (5460 米 ) 的 用 户 。 当 然 ， 这 并 不 是 说 
只 要 客户 在 中 央 电 话 交 换 局 距离 18000 英尺 的 范围 内 就 行 了 ， 因 为 服务 电缆 的 路 由 路 径 很 少 是 直线 。 

传统 模拟 电话 业务 ，POTS， 在 某 个 框架 (frame) 内 ， 或 者 说 是 在 中 央 电 话 交 换 局 的 交换 中 心 终 
止 本 地 环 路 业务 。 从 一 个 交换 中 心 到 另 一 个 交换 中 心 都 有 专用 电路 ， 也 许 这 个 专用 电路 连接 到 一 个 长 
途中 继 线 上 ， 也 许 是 直接 从 交换 中 心 出 来 又 回 到 同一 个 本 地 回路 。 所 有 传统 的 电路 交换 都 建立 在 模拟 
连接 的 特征 基础 .上 。 

正如 在 ISDN 讨论 中 所 解释 的 一 样 ， 模 拟 中 央 电 话 交 换 局 的 配置 和 数字 技术 是 不 兼容 的 。 与 这 些 
模拟 电话 转换 开关 等 价 的 数字 产品 是 DSL 访问 多 路 复 用 器 (DSL access multiplexer，DSLAM ) 。 
DSLAM 组 合 来 自 多 个 用 户 线路 的 DSL 通信 量 集 中 到 交换 以 太 网 ，T-1/E-1，T-3/E-3 或 者 是 ATM 的 
载体 上 ， 来 实现 对 因特网 或 其 他 数字 服务 的 访问 。 有 些 DSLAM 还 可 以 连接 到 POTS 的 交换 框架 上 ， 
提供 语音 和 数字 服务 。 

根据 用 户 的 要 求 ， 某 些 DSL 会 使 用 一 个 分 配器 把 语音 从 数字 信息 流 中 分 离 出 来 。 数 字 信和 号 会 在 一 
个 被 称 为 DSL 调制 解 调 器 的 编码 器 或 解码 器 设备 上 终止 传输 。 

DSL 使 用 两 种 不 同 的 且 不 兼容 的 调制 方法 : 无 载波 振幅 相位 (Carrierless Amplitude Phase， 
CAP) 和 离散 多 音频 服务 (Discrete MultiTone Service，DMT) 。 其 中 ，CAP 是 一 种 比较 老 且 简单 的 技 
术 ， 而 DMT 对 DSL 来 说 是 一 种 ANSI 的 标准 。 

CAP 使 用 三 种 频率 范围 : 0 到 40KHz 是 为 语音 服务 的 ，25KHz 到 160KHz 是 为 了 “上 传 〈up- 
stream)” 通 信和 量 〈 比 如 通过 浏览 器 发 送 一 个 命令 来 请 求 浏览 特定 的 Web 页 )，240KHz 到 1. 5MHz 是 
为 了 “下 传 (downstream)” 通 信 重 (递送 所 请 求 的 Web 页 )。 这 种 不 平衡 访问 方法 称 为 非 对 称 数 字 用 
户 线 (Asymmetric Digital Subsriber Line，ADSL) 。 因 为 大 多 数 的 Web 会 话 过 程 涉 及 大 量 的 下 传 通信 
量 而 不 是 上 传 通信 量 ， 所 以 ADSL 十 分 适合 于 家 庭 和 小 型 企业 的 因特网 访问 。 

当然 ， 由 于 CAP 使 用 固定 大 小 的 信道 ，CAP 的 用 户 就 会 被 锁定 在 一 个 135KHz 的 上 传 带宽 上 。 
这 对 于 希望 上 载 大 量 文件 或 者 要 求 远程 连接 到 一 个 局 域 网 (LAN) 上 的 用 户 来 说 ， 可 能 就 不 是 理想 的 
情况 了 。 在 这 些 情况 下 ，DMT DSL 可 以 提供 更 好 的 性 能 。DMT 把 一 个 1MHz 频率 的 带宽 分 割 成 256 
个 4KHz 的 信道 ， 称 为 音调 (tone)。 这 样 的 信道 能 够 以 同时 适合 于 用 户 和 供应 商 的 任何 方式 进行 配 
置 。 例 如 ，DMT 可 以 很 方便 地 接纳 某 个 需要 192 个 4KHz (768KHz) 的 上 载 信道 和 仅 要 求 64 个 
4KHz (256KHz) 的 下 载 信道 的 用 户 。 尽 管 这 种 服务 是 可 能 的 ， 但 是 DMT 更 经 常 的 是 利用 它 的 灵活 
性 来 适应 线路 质量 的 波动 。 当 DMT 设备 检测 到 在 某 个 信道 上 存在 太 大 的 串 音 或 过 多 的 衰减 时 ， 它 会 
停止 使 用 这 条 信道 ， 直 到 这 种 情况 得 到 改善 。 虽 然 在 采取 这 样 的 措施 后 ,线路 的 比特 率 会 降低 ， 但 是 
实际 的 吞吐 量 提 高 了 ， 因 为 有 故障 的 信道 可 能 会 引起 多 次 数据 重 发 的 现象 ， 通 常 这 种 情况 下 造成 的 实 
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际 吞 吐 量 的 减少 要 比 损失 1 个 或 2 个 4KHz 信道 所 产生 的 影响 更 大 。 

DSL 决 不 会 只 限制 在 居民 区 使 用 。 高 容量 的 DSL 技术 可 以 应 用 在 商业 T-1/E-1、T-3/E-3 和 ATM 
服务 中 。 在 20 世纪 90 年 代 期 间 出 现 了 许多 DSL 技术 ， 相 信 以 后 会 出 现 更 多 这 样 的 技术 。 至 于 哪 种 是 
“最 好 的 ”技术 目前 还 没有 一 致 的 定论 ， 估 计 在 今后 的 十 多 年 时 间 将 会 由 市 场 筛选 出 几 种 能 够 生存 的 技 
术 产 品 。 为 了 帮助 读者 在 这 种 混乱 的 局 面 中 找到 合适 的 解决 方案 ， 我 们 在 表 11-5 中 列举 了 一 些 流行 的 
DSL 技术 的 简短 归纳 ， 供 大 家 参考 。 


表 11-5 ADSL 词汇 表 





非 对 称 数字 用 户 线 : 将 本 地 回路 传输 线 分 割 成 不 同 的 带宽 ， 下 传 带宽 比 上 传 带 宽大 得 多 。 通 常 支持 
同一 双 绞 线 上 的 POTS 

SDSL 对 称 DSL: 带宽 在 上 传 和 下 传 通信 和 量 中 同等 分 配 

很 高 比特 率 的 DSL: 为 短 距离 传输 而 设计 ， 通 过 光学 介质 连接 两 个 邻近 的 网 络 。VDSL 支持 4500 
英尺 距离 内 速度 为 12.9Mb/s 的 传输 和 1000 英尺 距离 内 速度 为 52. 8Mb/s 的 传输 
IDSL 通过 ISDN 的 DSL: 允许 DSL 的 使 用 超过 18000 英尺 的 限制 ,但 是 吞吐 量 限制 为 128Kb/s 

速率 自 适应 的 DSL: 根据 线路 质量 自我 配置 传输 速率 ， 具 有 一 定 的 能 力 可 以 超越 18000 英尺 限制 进 
行 传输 (通过 降低 传输 速率 ) 

另外 一 种 承诺 可 以 突破 18000 英尺 壁 急 的 DSL。 有 些 供 应 商 声称 其 ReachDSL 服务 可 以 覆盖 距离 
CO 30000 英尺 的 范围 

一 个 为 住宅 区 用 户 设计 的 DSL 专用 版 本 ， 除 了 数据 通信 外 还 支持 语音 通信 ， 上 传 速度 为 500Kb/s 
和 下 传 速度 为 1. 5Mb/s 

ITU-T 的 SDSL 标准 〈G. 199. 2) ， 在 各 种 不 同 商业 层次 的 DSL 中 相互 使 用 。 它 使 用 两 对 双 绞 线 支 
持 数 据 传输 速率 从 192Kb/s 到 2. 3Mb/s 的 范围 


11.8.2 邀 游 因特网 


模拟 本 地 回路 仅仅 是 因特网 目前 面临 的 许多 问题 中 的 其 中 之 一 。 另 外 一 个 更 严重 的 问题 是 主干 网 
络 的 高 速 链 路 路 由 器 的 交通 堵塞 问题 。 在 美国 ， 沿 着 不 同 的 主干 网 络 上 有 超过 50 000 个 路 由 器 ， 更 新 
路 由 表 的 工作 常常 是 高 速 链 路 上 的 重要 通信 量 。 路 由 表 的 汇总 任务 也 需要 花费 大 量 的 时 间 。 老 旧 的 线 
路 会 长 时 间 阻 碍 通信 流量 ， 当 系统 试图 解决 出 现 的 错误 时 会 引起 更 多 的 阻塞 问题 。 当 路 由 器 出 现 故障 ， 
会 产生 一 些 非 常 严重 的 问题 ， 出 错 的 路 由 器 会 向 整个 主干 网 络 系统 广播 错误 的 路 由 。 这 就 是 大 家 所 熟 
知 的 路 由 器 不 稳定 性 问题 (router instability problem) ， 并 且 这 还 是 一 个 正在 继续 研究 的 领域 。 

毫 无 疑问 ， 一旦 IPv6 得 到 广泛 采用 ， 这 些 问 题 将 不 复 存在 ， 因 为 路 由 表 会 变 得 越 来 越 小 (假定 使 
用 可 聚集 的 全 局 统一 地 址 ) 。 但 是 ， 由 于 每 天 有 几 百 万 个 路 由 公告 发 生 ， 所 以 仍 存在 许多 困难 。 而 且 要 
试图 使 数 万 个 路 由 表 任 何 时 候 都 对 待 网 络 的 看 法 一 致 ， 还 存在 许多 物理 限制 。 最 后 ， 如 果 高 速 链 路 的 
发 展 要 与 市 场 的 需求 保持 同步 ， 则 需要 进行 一 些 更 深层 次 的 分 析 研 究 工 作 。 这 些 工作 的 结果 可 能 会 导 
致 产生 新 一 代 路 由 的 协议 。 可 以 肯定 的 是 : 从 长 远 的 观点 来 说 ， 简 单 地 给 因特网 增加 带宽 并 不 使 得 网 
络 的 速度 会 变 得 更 快 。 因 特 网 必须 变 得 更 加 智能 化 。 


本 章 小 结 


本 章 全 面 概述 了 构建 数据 通信 系统 中 所 使 用 的 网 络 设备 和 协议 。 每 个 网 络 设备 、 网 络 进程 ， 都 在 一 个 分 
层 协议 堆栈 中 的 某 个 层次 执行 相应 的 任务 。 网 络 工程 师 使 用 OSI 参考 模型 的 不 同 层次 来 描述 各 种 网 络 设备 的 
作用 和 功能 。 当 一 台 计算 机 与 另 一 台 计 算 机 进行 通信 时 ， 在 协议 堆栈 上 运行 每 一 层 都 会 与 运行 在 远程 计算 机 
系统 上 相对 应 的 层 进行 会 话 。 而 系统 中 各 个 协议 层 之 间 也 会 使 用 各 自 的 服务 访问 点 与 它们 相 邻 的 层 进行 交流 。 
大 部 分 网 络 应 用 都 依赖 于 TCP/IP 协议 。 到 目前 为 止 ， TCP/IP 协议 是 最 广泛 应 用 的 数据 通信 协议 。 虽 
然 我 们 经 常 提 到 TCP/ 了 协议 ， 实 际 上 它 是 这 两 种 协议 的 组 合 。TCP 提供 了 一 种 在 不 可 靠 的 卫 协 议 的 顶部 
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建立 可 靠 的 通信 流 的 方法 。IP 第 4 版 中 的 设备 受到 32 位 地 址 域 的 限制 。IP 第 6 版 将 可 以 解决 这 个 间 题 ， 
内 为 IPv6 的 地 址 字段 有 128 位 的 宽度 。 巾 于 这 些 地 址 字段 的 宽度 比较 大 ， 所 以 路 由 选择 就 成 了 一 个 很 困难 
的 问题 。 基 于 这 种 原因 ，IETF 设计 了 一 种 分 层 结构 的 地 址 方案 ， 即 可 聚集 的 全 局 统一 地 址 格式 。 这 种 方法 
可 以 使 数据 包 的 路 由 变 得 更 方便 更 快捷 。 

本 章 讨 论 了 许多 在 大 部 分 数据 通信 网 络 中 通用 的 设备 。 这 些 设 备 中 最 重要 的 是 物理 介质 和 路 由 器 。 选 
择 物理 介质 时 必须 考虑 预期 的 通信 和 负荷 和 网 络 覆 盖 的 距离 。 需 要 时 ， 物 理 介质 可 以 利用 转发 器 来 延伸 。 路 
由 器 是 用 来 监视 网 络 的 状态 的 复杂 设备 。 路 由 器 中 的 内 置 程序 允许 路 由 器 为 网 络 通信 重 选 择 最 优 的 路 径 。 

公用 交换 电话 网 将 继续 为 将 因特网 连接 到 家 庭 用 户 和 小 型 企业 服务 。 但 是 ， 用 户 和 电话 交换 中 心 之 间 
的 连接 还 是 模拟 电路 ， 最 大 传输 速率 只 有 30000b/s。 人 们 采用 一 些 方 法 来 改善 这 种 状况 ，ISDN 和 DSL 就 
是 两 种 适合 于 家 庭 用 户 和 小 型 企业 的 数字 载体 服务 。 

但 是 ， 公 用 交换 电话 网 仅仅 是 网 络 发 展 过 程 中 过 到 的 障碍 之 一 。 另 外 一 个 问题 是 主干 网 络 路 由 器 的 交 
通 堵塞 。 随 着 因特网 作为 商用 介质 不 断 地 旦 指数 形式 增长 ， 路 由 中 遇 到 的 各 种 问题 也 会 成 比例 增加 。 这 些 
问题 的 最 终 解 决 方法 可 能 需要 重新 思考 现在 的 网 络 结构 ， 以 及 目前 人 们 熟知 的 构成 因特网 基础 的 某 些 基本 
假定 。 
深入 阅读 

关于 计算 机 网 络 主题 的 文献 很 多 。 但 是 ， 现 在 想 找到 好 的 网 络 资料 却 不 是 一 件 容易 的 事情 。 在 数据 通 
信 方 面 最 适合 的 书籍 包括 : Tanenbaum (1996)、Stallings (2000) 以 及 Kurose 和 Ross (2001) 等 人 的 著 
作 。Tanenbaum 是 按照 OSI 协议 堆栈 来 组 织 内容 的 ， 读 者 非常 容易 地 理解 有 关 数 据 通信 和 网 络 的 许多 重要 
概念 。Kurose 和 Ross 详细 讨论 了 在 本 章 中 提出 的 大 部 分 议题 ， 而 且 内 容 的 深度 可 以 为 大 多 数 有 兴趣 的 读 
者 接受 。Stallings 的 著作 和 Tanenbaum 的 著作 中 的 内 容 基 本 相同 ， 但 是 Stallings 的 著作 比较 严 灌 和 详细 。 
Sherman (1990) 同样 很 好 地 介绍 了 数据 通信 方面 的 内 容 (可 能 会 有 点 陈旧 )。Sherman 对 数据 通信 历史 发 
展 的 看 法 还 是 值得 阅读 的 。 

有 关 网 络 标 准 (草案 ) 最 权威 信息 的 来 源 可 以 访问 内 特 网 工程 任务 组 的 网 站 www. ietf. org。 以 及 本 章 
中 相关 的 RFC 资料 为 ， 

。RFC791“ 网 际 协议 版 本 4 (IPv4)” 

。RFC793“ 传 输 控 制 协议 (TCP)” 

。RFC1180“TCP/IP 指南 ” 

。RFC1887“IPv6 统一 地 址 分 配 的 体系 结构 ” 

。，RFC2460“ 网 际 协议 版 本 6 (IPv6) 详细 说 明 ” 

。RFC2026.“ 网 际 标 准 过 程 ” 

*。RFC1925“ 网 络 的 基本 原理 ” 

由 Rodriguez、Getreil、Karas 和 Peschke (2001) 合 编 的 IBM 的 TCP/IP 指南 是 IETF 之 外 最 经 济 最 易 
读 的 资料 。 与 IETF 网 站 的 内 容 不 同 ， 这 本 说 明 书 是 以 一 个 特定 的 供应 商 的 产品 为 出 发 点 讨论 了 实现 TCP/ 
IP 的 方式 ， 这 里 不 可 能 有 虚构 的 成 分 。Minoli 和 Schmidt (1999) 讨论 了 网 络 的 基本 设施 ， 重 点 关注 的 是 
服务 质量 的 问题 。 

Clark (1997) 详细 全 面 地 论述 了 有 关 电 话 通信 (重点 集中 在 英国 ) 的 问题 。 这 本 书 讨论 了 公用 电话 交 
换 网 的 一 些 重要 方面 ,其 中 包括 电话 网 络 传送 数据 通信 的 能 力 。Burd (1997) 有 关 ISDN 和 Prycker 
(1995) 有 关 ATM 的 书籍 都 是 这 些 方面 的 权威 著作 。1IBM (1995) 的 ATM 指南 ， 虽然 没 有 Prycker 论述 
严谨 ， 但 是 也 客观 和 详细 地 对 ATM 最 突出 的 特点 进行 了 精辟 论述 。 

要 了 解 有 关 因 特 网 主干 网 络 路 由 器 的 不 稳定 性 问题 的 更 多 信息 ， 可 以 参考 Labovitz、Malan 和 Jahanian 
(1998) 的 论文 。 密 于 根 大 学 还 设立 了 一 个 网 站 来 讨论 有 关 网 络 性 能 的 问题 。 网 站 地 址 为 ， 
www. merit. edu/ipma/ 。 


要 保持 接触 数据 网 络 技术 的 最 新 发 展 的 唯一 方法 是 ， 经 常 不 断 阅读 有 关 的 专业 期 刊 和 商业 期 刊 。 在 
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ACM 和 IEEE 出 版 的 刊物 中 可 以 找到 最 前 沿 (avant-garde〉 的 信息 。IEEE/ACM 《Transactions on Networ- 
king》 和 《IEEE Network》 是 两 种 非常 优秀 的 专业 期 刊 。 行 业 杂 志 是 获取 新 信息 的 另 一 种 好 来 源 ， 特 别 是 
可 以 了 解 各 个 网 络 提供 商 如 何 来 实现 最 新 的 网 络 技术 。 有 两 种 CMP 出 版 这 类 的 杂志 ， 分 别 是 网 络 计算 
(www. network, computing. com) 和 网 络 杂志 (www. networkmaganize. com) 。《 网 络 世界 》 是 由 CW 通信 
公司 出 版 的 周刊 杂志 ， 它 不 仅 提供 了 高 质量 的 印刷 版 面 ， 而 且 还 附 有 相关 的 网 站 www. nwfusion. com， 提 
供 大 二 的 信息 和 资源 。 

许多 设备 供应 商都 在 其 网 站 公布 了 一 些 很 好 和 真实 的 学 习 资 料 。 这 些 公司 网 站 包括 IBM 公司 、Cisco 公 
司 和 Corning Glass 公司 。 当 然 ， 如 果 读 者 想 探 究 本 章 提出 的 相关 主题 的 一 些 特 定 技术 ， 也 能 够 发 现 其 他 一 些 
非常 好 的 商业 网 站 。 当 谈 到 数据 通信 问题 时 ， 不 管 学 习 多 么 努力 ， 但 似乎 人 们 所 了 解 的 知识 永远 都 是 不 够 。 
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基本 概念 和 术语 复习 


一 个 轮 询 网 络 的 组 织 结构 和 因特网 网 络 的 组 织 结构 有 了 哪些 区 别 ? 

. 什么 协议 设备 对 于 DARPAnet 网 络 的 基础 是 关键 性 的 设备 ? 

. 谁 为 因特网 制定 了 网 络 标准 ? 

. 因特网 标准 的 正式 名 称 是 什么 ? 

. 1SO/OSI 参考 模型 的 哪 一 层 负责 协 议 帧 大 小 和 传输 速率 ? 

. 如 果 一 个 通信 会 话 要 使 用 加 密 或 者 压缩 ， 那 么 ISO/OSI 参考 模型 中 的 哪 一 层 负责 完成 这 项 任务 ? 

. 根据 第 11.5. 1 节 中 给 出 的 IPv4 格式 ，IP 协议 数 占 据 了 多 少 位 的 位 置 ? 这 个 域 〈 字 段 ) 的 目的 是 什么 ? 
. 为 什么 某 些 类 型 的 IP 地 址 会 非常 稀少 ? 


Go “四 让 
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9. 解释 TCP 协议 的 一 般 用 途 ? 

10. IPv6 对 IPv4 如 何 进行 改进 的 ? 

11. 导向 数据 传输 介质 和 非 导向 数据 传输 介质 的 区 别 是 什么 ? 分别 举 几 个 例子 。 
12. 什么 因素 决定 了 传输 介质 的 质量 ”可 以 采用 什么 样 度量 方法 ? 
13. 衰减 的 主要 原因 是 什么 ? 什么 方法 有 助 于 减少 衰减 ? 

14. 线路 中 的 波 特 率 和 比特 率 的 区 别 是 什么 ? 

15. 光缆 有 哪 三 种 类 型 ? 哪 一 种 光缆 传输 信号 的 速度 最 快 ? 

16. 在 哪里 能 够 找到 MAC 地 址 ? 一 个 MAC 地 址 有 多 少 个 字 节 ? 
17. 简要 描述 转发 器 、 集 线 器 、 交 换 机 和 路 由 器 彼此 之 间 有 哪些 区 别 ? 
18. 网 桥 和 网 关 之 间 有 什么 不 同 ? 哪 一 个 速度 更 快 ? 为 什么 ? 
19. 何 时 不 宜 使 用 静态 路 由 方法 ? 

20, 给 出 链接 静态 路 由 和 距离 矢量 路 由 所 不 同 的 两 种 重要 方式 ? 
21. 距离 矢量 路 由 产生 的 三 个 主要 问题 是 什么 ? 

22. 防火 墙 采用 什么 样 的 方式 提供 安全 ? 

23, 什么 是 脉 码 调制 ? 

24. 什么 是 时 分 复 用 ? 

25. PDH 和 SONET/SDH 的 区 别 是 什么 ? 

26. ISDN 存在 什么 问题 ? 

27. 使 用 ATM 的 主要 好 处 是 什么 ? 

28. ATM 主要 的 限制 是 什么 ? 

29, 相位 变化 调制 是 如 何 工作 的 ? 

30. 格 码 调制 和 正 交 幅度 调制 有 如 何 的 区 别 ? 

31. DSL 主要 的 限制 是 什么 ? 

32，DSL 有 了 哪 两 种 类 型 7 哪 一 个 是 ANSI 标准 ? 

33, 描述 路 由 器 的 不 稳定 性 问题 。 


练习 题 


1. 早期 的 企业 计算 机 网 络 的 通信 业务 和 早期 的 科学 学 术 网 络 的 通信 业务 有 什么 区 别 ? 现在 ， 这 两 种 类 型 的 
系统 还 有 这 样 的 区 别 吗 ? 

2. 为 什么 ISO/OSI 协 议 堆栈 被 称 作 参考 模型 ? 你 认为 将 来 也 是 这 种 情况 吗 ? 

3, 如 何 区 别 网 络 层 协议 和 传输 层 协议 ? 

4. 网 际 协议 标准 是 通过 世界 上 许多 人 的 共同 努力 设计 出 来 的 ， 而 不 管 这 些 人 在 数据 通信 领域 有 任何 特殊 的 
背景 。 在 另 一 方面 ， 专 用 协议 却 都 是 由 少数 人 创建 的 ， 这 些 人 都 直接 或 间接 地 为 同一 个 雇主 工作 。 

a) 你 认为 每 一 种 方法 提供 的 优点 和 缺点 是 什么 ? 哪 一 种 方法 可 以 产生 更 好 的 结果 ? 而 哪 一 种 方法 可 以 更 
快 地 产生 结果 ? 

b) 你 认为 为 什么 IETF 的 方法 会 在 与 专用 方法 的 竞争 中 取得 优势 ? 

. 在 描述 TCP 头 部 窗口 字段 时 ， 我 们 曾经 说 到 : 

如 果 发 现 接收 方 的 应 用 程序 运行 得 非常 慢 ， 比 如 每 次 只 从 缓冲 器 拿 出 一 个 或 两 个 字 节 的 数据 ， 那 么 运 
行 在 接收 端的 TCP 进程 就 应 该 等 待 ， 直 到 应 用 程序 的 缓冲 器 有 足够 的 空间 可 以 发 送 另 一 个 报 文 段 。 
请 问 : 

判断 可 以 发 送 另 一 个 报 文 段 的 理由 是 什么 ? 

.OSI 协议 堆栈 除了 应 用 层 外 ， 还 包括 会 话 屋 和 表示 层 。TCP/I 的 应 用 程序 ， 例 如 Telnet 和 FTP， 没 有 
这 种 分 立 的 定义 层次 。 你 认为 需要 有 这 样 的 分 隔 吗 ? 给 出 将 OSI 方法 应 用 到 TCP/IP 中 的 一 些 优 点 和 
缺点 ? 
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一 个 TCP 报 文 段 的 长 度 为 什么 要 限制 为 65515 个 字 节 ? 
为 什么 IETF 要 使 用 字 8 位 位 组 而 不 是 字 节 ? 你 认为 这 种 做 法 应 该 继续 实行 吗 ? 
下 面 的 IP 地 址 分 别 属 于 哪 类 网 络 ? 


会 a) 180. 265. 14. 3 
争 b) 218. 193. 149. 222 
会 c) 92. 146. 292. 7 
10. 下 面 的 IP 地 址 分 别 属于 哪 类 网 络 ? 


11 


12. 


令 13 


14. 


15. 
16, 
17. 


18. 


争 19. 


20. 


a) 223.52. 176. 62 

b) 127. 255. 255. 2 

c) 191. 57. 229. 163 

. 运行 TCP/1IP 协议 的 某 个 站 点 需要 向 主机 传送 一 个 文件 。 这 个 文件 包含 1024 字 节 。 问 : 在 传输 文件 时 

将 传送 多 少 字 节 ? 其 中 包括 全 部 的 TCP/IP 开销 ， 有 效 载荷 的 大 小 是 128 个 字 节 ， 两 个 系统 都 运行 IPv4 

(同时 还 假定 三 次 握手 和 窗口 大 小 的 协商 已 经 完成 ， 而 且 在 传输 过 程 中 没有 发 生 错 误 )、 请问: 

令 a) 协议 开销 的 大 小 是 多 少 〈 用 百分比 表示 )? 

令 b) 如 果 假 定 两 个 客户 端 都 使 用 IPv6 ， 进 行 与 上 面相 同 的 计算 ? 

运行 TCP/IP 协议 的 某 个 站 点 需要 向 主机 传输 一 个 文件 。 这 个 文件 包含 2048 字 节 。 问 : 在 传输 文件 时 

将 传送 多 少 字 节 ? 其 中 包括 全 部 的 TCP/IP 开销 ， 有 效 载荷 的 大 小 是 512 字 节 ， 两 个 系统 都 运行 IPv4 

(同时 还 假定 三 次 握手 和 窗口 大 小 的 协商 已 经 完成 ， 而 且 在 传输 过 程 中 没有 发 生 错 误 ) 。 

a) 协议 开销 的 大 小 是 多 少 〈 用 百分比 表示 )? 

b) 如 果 假 定 两 个 客户 端 都 使 用 IPv6 ， 进 行 与 上 面相 同 的 计算 ? 

. 运行 TCP/ 了 PP 协议 的 两 个 站 点 要 传输 一 个 文件 。 文 件 长 度 为 100KB， 有 效 载 荷 的 大 小 为 100 字 节 ， 协 

商 的 窗口 大 小 为 300 字 节 。 发 送 方 从 接收 方 收 到 一 个 ACK 1500。 

令 a) 下 面 将 发 送 哪 些 字 节 ? 

令 b) 如 果 接 收 方 没有 发 送 一 个 ACK 信号， 那么 可 以 发 送 的 最 后 一 个 字 节 数 是 多 少 ? 

运行 TCP/IP 协议 的 两 个 站 点 要 传输 一 个 文件 。 文 件 长 度 为 0KB， 有 效 载荷 的 大 小 为 100 字 节 ， 协 商 

的 窗口 大 小 为 2000 字 节 。 发 送 方 从 接收 方 收 到 一 个 ACK 900。 

a) 下 面 将 发 送 哪 些 字 节 ? 

b) 如 果 接 收 方 没有 发 送 一 个 ACK 信号， 可 以 发 送 的 最 后 一 个 字 节 数 是 多 少 ? 

如 果 TCP 不 允许 发 送 方 和 接收 方 协商 一 个 超时 窗口 ， 那 么 将 会 出 现 什么 问题 ? 

IP 是 一 个 无 连接 协议 ， 而 TCP 却 是 一 个 面向 连接 的 协议 。 这 两 个 协议 如 何在 同一 个 协议 堆栈 中 共存 ? 

在 第 11. 6. 1 节 中 谈 到 ， 当 使 用 4B/5B 编码 时 ， 一 个 比特 率 为 100Mb/s 的 传输 介质 要 求 125MHz 的 信 

号 传送 容量 。 

a) 如 果 使 用 曼彻斯特 (Manchester) 编码 将 需要 多 大 的 信号 传送 容量 ? 

b) 如 果 使 用 改进 的 频频 率 调制 MFM) 编码 将 需要 多 大 的 信号 传送 容量 ? 假设 0 和 1 发 生 的 几率 
相等 。 

( 曾 在 第 2 章 中 对 曼彻斯特 编码 做 了 解释 ) 

a) 对 于 某 种 特定 类 型 的 网 络 连 线 来 说 ， 信 号 功率 是 8733. 26dB， 而 且 在 这 个 特定 的 信号 强度 和 
100MHz 传输 频率 下 ， 噪 声 等 级 为 41.8dB。 试 计算 这 个 导体 的 信 品 比 。 

b) 假定 a 部 分 的 网 络 连 线 的 噪声 等 级 为 9. 5dB， 当 传输 一 个 200MHz 的 信号 时 噪声 等 级 为 36. 9dB。 信 
号 强度 是 多 少 ? 

a) 对 于 某 种 特定 类 型 的 网 络 连 线 来 说 ， 信 号 功率 是 2898dB， 而 且 在 这 个 特定 的 信号 强度 和 100MHz 传 
输 频 率 下 ， 了 噪声 等 级 为 40dB。 试 计算 这 个 导体 的 信和 品 比 。 

b) 假定 a 部 分 的 网 络 连 线 的 噪声 等 级 为 0. 324B， 当 传输 一 个 200MHz 的 信号 时 噪声 等 级 为 35dB。 信 
号 强度 是 多 少 ? 

一 个 物理 PDU 有 多 大 ? 这 个 问题 的 答案 决定 了 在 许多 网 络 体系 结构 中 同时 传输 的 数目 。 如 果 一 个 信和 号 
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22. 


23. 


24. 


25. 


26. 
27， 


28. 


29. 


通过 铀 导线 传播 的 速率 是 2x 108 米 / 秒 ， 然 后 在 一 个 以 速率 为 10Mbys 运行 载波 ,每 位 脉冲 长 度 由 下 式 
给 出 : 


传播 速度 _ 2Xx10*m/s _ . 
总 线 速度 10X105by/s 20 米 /位 


如 果 数 据 帧 为 512 位 长 ， 那 么 整个 帧 占据 的 长 度 为 : 

《每 位 长 〉 XX ( 帧 大 小 ) = 二 20X512= 二 10240 米 

a) 如 果 网 络 运 行 速度 100Mb/s， 那 么 一 个 1024 位 的 数据 包 有 多 大 ? 

b) 如 果 网 络 速度 增加 到 155Mb/s， 其 结果 义 是 多 大 ? 

c) 在 速度 为 100Mb/s 时 ， 通 过 网 络 中 的 某 个 特定 点 时 需要 多 长 时 间 ? 

看 起 来 在 图 11-14 中 的 4B/5B 位 单元 是 非常 小 。 实 际 上 ， 在 一 个 125MHz 的 链 路 上 这 样 一 个 位 单元 到 
底 有 多 长 ?〈 使 用 上 一 个 问题 的 常数 和 公式 。) 

参考 图 11-21， 假 定 路 由 器 4 要 从 路 由 器 3 和 路 由 器 1 的 路 由 表 中 推演 出 自己 的 路 由 表 。 使 用 与 其 他 3 
个 路 由 器 的 路 由 表 的 相同 的 格式 ， 完 成 路 由 器 4 的 路 由 表 。 

因为 已 经 使 用 了 格 码 和 其 他 相位 变化 技术 来 增加 普通 电话 线路 的 信号 传输 容量 ， 所 以 我 们 难道 不 可 以 
在 数字 线路 上 做 同样 的 事情 吗 ? 

在 11. 8.1 节 中 曾经 介绍 ， 利 用 Shannon 定律 ， 可 以 知道 一 个 标准 模拟 电话 线路 的 最 大 数据 速率 大 约 是 
30 000b/s， 而 信 品 上 比 是 30dB。 这 里 ， 信 号 噪音 的 比值 为 1000， 正 如 在 11. 6.1 节 中 所 解释 的 ， 信 了 品 比 
是 10logw 信 号 dB/ 噪 声 dB。 

如 果 通 过 一 个 信 品 比 为 20dB 的 10KHz 信道 发 送 二 进 制 信和 号， 那么 可 以 获得 的 最 大 数据 速率 是 多 少 ? 
使 用 与 上 一 个 问题 相同 的 思想 ， 假 定 一 个 信道 的 计划 容量 是 10Mb/s， 带 宽 是 4MHz。 要 获得 这 样 的 数 
据 速率 ， 信 道 的 最 小 信 躁 比 是 多 少 ? (用 dB 表示 ) 

构建 一 个 时 序 图 来 说 明 两 个 调制 解 调 器 如 何 使 用 RS-232-C 协议 建立 一 个 连接 。 

北美 地 区 的 TDM DS-0 慎 通 过 线路 上 的 某 个 点 需要 125ps。 欧 洲 等 价 的 数据 帧 通过 线路 上 的 某 个 点 需要 
多 少 毫 秒 ? 

图 11-33b 说 明了 一 个 TCM 的 星座 图 。 设计 一 个 位 串 编码 用 于 这 个 星座 图 。 

(提示 : 这 32 个 信号 点 可 以 编码 4 位 长 的 位 串 。 第 5 位 用 作 奇 偶 位 。 在 这 个 练习 中 ， 既 可 以 采用 奇 校 
验 ， 也 可 以 采用 偶 校 验 .) 

设计 一 个 格 码 调制 的 点 阵 图 和 每 波 特 可 以 编码 4 位 的 编码 方案 〈 包 括 校 验 位 ) 。 








当 人 们 都 奉行 前 人 裁 树 ， 后 人 乘凉 时 ， 一 种 文明 就 繁荣 起 来 了 。 
一 一 硕 腾 富 言 


附录 A 数据 结构 和 计算 机 


A.1 概述 


在 整个 教材 的 学 习 过 程 中 ， 我 们 认为 读者 是 理解 计算 机 数据 结构 的 基本 知识 的 。 当 然 ， 这 些 知识 
对 于 阅读 本 书 并 不 是 必须 的 ， 但 是 它 对 读者 更 加 细致 地 掌握 计算 机 组 成 原理 和 体系 结构 的 某 些 知 识 点 
是 非常 有 帮助 的 。 本 附录 的 目的 是 想 对 已 经 具备 数据 结构 基本 知识 的 读者 做 … 些 知识 词汇 的 扩展 。 对 
于 以 前 学 过 数据 结构 的 读者 ， 本 附录 也 适合 作为 一 个 复习 材料 。 基 于 这 些 思想 ， 本 部 分 的 介绍 将 尽量 
简短 ， 而 且 主要 倾向 于 硬件 方面 的 考虑 。 如 果 读 者 有 兴趣 进一步 学 习 数据 结构 ， 建 议 阅读 本 附录 结尾 
处 所 引用 的 参考 文献 。 当 读者 学 习 本 附录 时 ， 应 该 意识 到 在 这 些 例子 中 使 用 的 所 有 的 存储 器 地 址 都 采 
用 十 六 进 制 数 。 如 果 对 十 六 进 制 数 还 没有 很 好 理解 ， 读 者 可 以 先 阅读 本 书 第 2 章 的 内 容 。 


A.2 基本 结构 


A.2.1 数组 


数据 结构 (data structure) 的 术语 是 信息 组 织 的 一 种 方式 。 有 了 合适 的 数据 结构 ， 计 算 机 的 执行 
过 程 可 以 在 需要 时 非常 方便 地 访问 各 种 数据 。 数 据 结构 通常 与 数据 结构 的 实现 无 关 ， 因 为 数据 的 组 织 
方式 是 逻辑 上 的 ， 而 不 必 是 物理 土 的 。 

最 简单 的 数据 结构 是 线性 数组 。 从 程序 设计 的 经 验 中 读者 可 能 知道 ， 线 性 数组 是 计算 机 存储 器 中 
的 一 块 连续 区 域 ， 一 般 在 程序 中 为 这 个 区 域 指定 了 一 个 名 字 。 存 储 在 这 个 区 域 中 的 实体 群 组 必须 是 同 
构 的 〈 即 这 些 实体 必须 具有 相同 的 大 小 和 类 型 )， 而 且 能 够 被 单独 编 址 ， 通 常 使 用 下 标 进行 编 址 。 例 
如 ,假定 有 如 下 的 Java 声明 : 


char [] charArray [10]; 


操作 系统 会 给 变量 chararray 分 配 一 个 存储 器 的 值 ， 表 示 数 组 的 基 址 (base address， 或 称 为 起 
始 地 址 ) 。 计 算 机 可 以 通过 距离 这 个 基础 位 置 的 偏 移 量 来 访问 后 续 的 字符 。 利 用 数组 原始 数据 类 型 的 大 
小 来 递增 偏 移 量 ， 在 这 里 ， 数 组 是 字符 数组 char。jJava 中 的 字符 是 16 位 宽 ， 所 以 字符 数组 每 个 数组 
元 素 的 偏 移 量 是 2 个 字 节 ， 例 如 ， 字 符 数 组 charArray 结构 存储 在 地 址 80A2， 程 序 声明 : 


char aChar = charArray [3] : 


在 存储 器 地 址 80A8 位 置 处 取 回 2 个 字 节 。 因 为 Java 数组 的 下 标 编号 是 从 0 开始 ， 所 以 刚才 已 经 
将 数组 中 的 第 4 个 元 素 存 储 到 了 字符 变量 achar 中 : 

80A2 十 2 字 节 /字符 XX 距离 基 址 开始 的 3 个 字符 偏 移 量 一 80A2 十 6 一 80A8 

二 维 数组 是 由 一 维 数组 组 成 的 线性 数组 ， 因 此 存储 器 中 的 偏 移 量 值 必须 要 考虑 数组 的 行 的 大 小 和 
原始 的 数组 数据 类 型 的 大 小 ， 例 如 ， 考 虑 下 面 的 Java 声明 : 


char [] charArray [4] [10] ; 


这 里 ， 我 们 定义 4 个 线性 数组 ， 每 个 线性 数组 有 10 个 存储 器 空间 。 但 是 ， 如 果 把 这 个 结构 当 作 是 
一 个 4 行 10 列 的 二 维 数 组 结构 来 考虑 ， 问 题 会 更 简单 。 如 果 字 符 数组 chararray 的 基 址 仍然 是 
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80A2， 那 么 字符 数组 元 素 [1] [4] 将 位 于 地 址 80BE 位 置 处 。 这 是 因为 数组 的 第 0 行 占 据 了 从 80A2 
到 80B5 的 地 址 位 置 。 数 组 第 一 行 的 起 始 地 址 是 80B6 ， 而 我 们 正 要 访问 的 是 第 二 行 的 第 5 个 元 素 : 

80B6 十 2 字 节 /字符 X 距 离 基 址 开始 的 4 个 字符 仿 移 量 王 80B6 十 8 一 80BE 

当 解 决 了 程序 问题 ， 人 允许 程序 在 数组 的 存储 位 置 的 一 个 小 的 子 集中 返回 地 址 时 ， 数 组 存储 方式 是 
一 个 很 好 的 选择 。 如 果 我 们 编写 一 个 十 五 子 棋 的 游戏 程序 ， 就 是 上 述 的 情况 。 例 如 ， 每 个 “点 ”就 是 
“棋盘 ”数组 上 的 一 个 位 置 。 这 个 程序 会 在 每 次 允许 移动 之 前 ， 只 检查 对 仍 子 所 掷 的 数字 是 合法 移动 的 
棋盘 点 的 位 置 。 

数组 的 另外 一 个 好 的 应 用 是 基于 时 间 天 数 或 月 天 数 的 数据 收集 任务 。 例 如 ， 我 们 可 能 计数 每 天 在 
不 同 的 时 间 通 过 高 速 公路 某 一 特定 点 的 车 辆 的 数目 。 如 果 以 后 需要 统计 在 上 午 9，00 到 9: 59 之 间 的 
平均 交通 流量 ， 那 么 只 需要 对 这 段 时 间 内 收集 的 数据 ， 即 每 天 24 小 时 数组 的 第 10 个 元 素 求 平均 值 
(午夜 到 上 午 1，00 是 第 0 个 元 未 ) 。 


A.2.2 队列 和 链表 


当 处 理 一 些 响 应 服务 要 求 的 项 目 时 ， 数 组 通常 不 是 非常 有 用 的 数据 结构 。 通 常情 况 下 根据 请 求 的 
时 间 来 处 理 服务 要 求 。 换 名 话说， 先 来 先 服务 。 

下 面 考虑 一 个 Web 服务 器 ， 处 理 来 自 因特网 用 户 的 超 文 本 传输 协议 (Hypertext Transfer Proto- 
col，HTTP) 的 请 求 。 可 以 将 这 些 服务 请 求 序 列 整理 出 来 ， 如 表 A-1 所 示 。 


表 A-1 一 个 Web 服务 器 的 HTTP 请 求 












源 地 址 
10. 122. 224. 5 
10. 167. 14. 190 
10. 148. 105. 67 
10. 72, 99. 56 


HTTP 命令 





07:22:03 http: //www. spiffywebsite. com/sitemap. html 














07:22:04 
07:22:12 
07:23:09 


http: //www. spiffywebsite. com/shoppingcart. html 








http: //www. spiffywebsite. com/spiffypix. jpg 














. spiffywebsite. com/userguide. html 


毫 无 疑问 ， 我 们 可 以 把 每 个 请 求 都 放 到 一 个 数组 里 面 ， 然 后 在 准备 服务 下 一 个 请 求 时 ， 搜 索 数 组 
查找 最 低 的 请 求 时 间 值 。 然 而 ， 这 个 执行 过 程 的 效率 非常 低 ， 因 为 数组 的 每 个 元 素 每 次 都 需要 被 询问 。 
而 县 ， 如 果 某 天 的 交通 流量 非常 大 ， 则 可 能 出 现 数组 存储 空间 滋 出 的 风险 。 由 于 这 些 原 央 ， 队 列 是 一 
种 非常 适合 于 先 来 先 服务 的 数据 结构 。 队 列 数据 结构 要 求 元 素 按照 队列 的 顺序 依次 排队 。 银 行 和 超市 
排队 等 候 服 务 就 是 很 好 的 队列 的 例子 。 

实现 队列 可 以 有 不 同 的 方式 ， 但 是 所 有 的 队列 实现 都 需要 有 4 个 组 成 部 分 : 一 个 用 来 指向 队列 的 
第 一 个 元 素 〈 队 头 ，head) 的 存储 器 变量 ， 一 个 用 来 指向 队列 的 最 后 一 个 元 素 〈 队 尾 ，trail) 的 存储 
器 变量 ， 用 来 存放 队列 的 各 个 元 素 的 存储 器 空间 和 一 组 针对 这 种 队列 数据 结构 的 操作 。 队 头 指 针 指示 
下 一 个 将 要 服务 哪 一 个 元 素 。 队 昆 指针 在 队列 的 末尾 增加 元 素 时 非常 有 用 。 如 果 队 列 的 队 头 指针 为 空 
(0)， 则 表示 这 个 队列 是 空 队 列 。 队 列 的 操作 通常 包括 在 〈 正 在 排队 ) 列表 的 末尾 添加 一 个 条 目 ， 在 列 
表 的 开始 处 删除 一 个 条 目 ， 以 及 检查 队列 是 否 为 空 。 

实现 一 个 队列 最 常用 的 方法 是 使 用 一 个 链表 (linked list) 。 在 链表 中 ， 队 列 中 的 每 个 元 素 都 包含 
一 个 指示 队列 中 下 一 个 元 素 的 指针 。 当 元 素 出 队列 时 ， 队 头 指针 会 使 用 在 刚刚 被 删除 的 节点 处 找到 的 
信息 来 定位 下 一 个 节点 。 因 此 ， 在 上 面 介绍 的 Web 服务 器 的 例子 中 ， 在 第 一 个 元 素 被 服务 〈 这 个 元 素 
就 从 这 个 队列 中 被 删除 ) 后 ， 队 头 指针 将 指向 第 二 个 数据 元 素 。 

现在 考虑 上 面 的 例子 中 的 表 A-1， 假设 这 里 的 队 头 地 址 为 7049， 这 个 地 址 中 存放 的 是 第 一 个 HT- 
TP 请 求 ，www. spiffywebsite. com/sitemap. html。 队 头 指针 的 值 为 7049。 在 此 存储 器 地 址 7049 的 位 
置 ， 有 如 下 的 条 目 : 

07: 22: 03, 10. 122. 224.5, www. spiffywebsite. com/sitemap. html, 70E6 
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其 中 ，70E6 是 下 面 的 元 素 的 地 址 : 
07: 22: 04, 10.167.14.190, www. spiffywebsite. com/shoppingcart. html, 712A, 


这 个 队列 的 全 部 内 容 如 表 A-2 所 示 。 
表 A-2 在 存储 器 中 一 个 HTTP 请 求 队列 的 实现 











队列 数据 元 素 





地 址 
















10. 122. 224. 5 


07; 22:03 
07.22:04 10. 167. 14. 190 


http: //www. spiffywebsite. com/sitemap. html 


















http: //www. spiffywebsite. com/shopping- 









cart. html 











07.22.12 10. 148. 105. 67| http: //www. spiffywebsite. com/spiffypix. jpg 
07.23:09 10. 72. 99. 56 


队 头 指针 设置 为 7049， 队 尾 指针 设置 为 81B3。 如 果 有 另 一 个 用 户 的 请 求 到 来 ， 那 么 系统 就 会 在 存 
储 器 中 为 这 个 新 的 请 求 找到 一 个 存放 空间 ， 并 且 更 新 最 后 一 个 队列 元 素 (指向 这 个 新 的 条 目 ) 以 及 队 
尾 指针 。 读 者 应 该 注意 到 ， 当 使 用 这 种 指针 结构 时 ， 与 数组 不 同 ， 它 并 不 要 求 数据 元 素 在 存储 器 中 是 
连续 存放 的 。 这 样 一 来 ， 在 需要 时 就 允许 这 种 结构 去 扩大 添加 元 素 。 另 外 ， 它 也 不 要 求 地 址 值 是 递增 
的 。 队 列 元 素 可 以 存放 在 存储 器 中 的 任何 位 置 。 这 些 指针 会 保持 队列 的 顺序 。 

我 们 可 以 对 上 面 介绍 的 队列 结构 进行 修改 ， 创 建 一 个 固定 大 小 的 队列 〈 通 常 称 为 循环 队列 ，circu- 
lar queue)， 或 者 是 创建 一 个 优先 级 队列 (priority queue) 。 在 优先 级 队列 中 ， 某 种 类 型 的 条 目 可 以 优 
先 于 其 他 条 目 。 即 使 有 这 些 增加 的 内 容 ， 队 列 也 还 是 很 容易 实现 的 数据 结构 。 


A.2.3 堆栈 


队列 有 时 也 称 为 先进 先 出 (first-in，first-out，FIFO) 列表 ， 理 由 是 非常 明显 的 。 某 些 应 用 却 需 
要 相反 的 顺序 ,或 者 说 后 进 先 出 (last-in，first-out，LIFO)。 堆 栈 (stacks) 就 是 符合 LIFO 顺序 的 数 
据 结构 。 堆 栈 名 字 的 由 来 非常 类 似 于 在 自助 餐 中 向 客户 提供 盘子 的 方式 。 自 助 餐 的 服务 人 员 把 一 些 
热 的 、 湿 的 和 干净 的 盘子 放 到 一 个 装 有 弹簧 管状 容器 的 顶部 ， 而 把 冷 的 和 干燥 的 盘子 下 压 到 管状 容 
器 的 底部 。 下 位 顾客 会 从 这 种 堆栈 的 顶部 取 走 一 个 盘子 。 这 种 顺序 过 程 如 图 A-1 所 示 。 图 A-1a 表示 
的 是 一 堆 盘 子 。1 号 盘 是 第 一 个 放 到 堆栈 中 的 ，7 号 盘 是 最 后 一 个 放 到 堆栈 中 的 。 而 7 号 盘 是 第 一 个 
从 堆栈 中 取 走 的 盘子 ， 如 图 A-1b 所 示 。 当 下 一 个 盘子 到 来 ， 也 就 是 8 号 盘 ， 将 会 被 放 到 堆栈 的 最 顶 












http: //www. spiffywebsite. com/userguide. html 








~ ~ 司 - ~ 
a) 初始 的 堆栈 b) 移 走 7 号 盘 (出 栈 ) c) 加 入 8 号 盘 (人 入 栈 ) 
图 A-1 盘子 堆栈 
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层 ， 如 图 A-lc 所 示 。 向 堆栈 中 增加 一 个 元 素 的 操作 称 为 压 入 (push)， 移 走 一 个 元 素 的 操作 称 为 弹 
出 《pop)。 要 询问 堆栈 的 栈 顶 〈 堆 栈 顶 部 ) 元 素 ， 不 是 采用 移 走 栈 顶 元 素 的 方法 ， 而 是 完 视 (peek) 
这 个 元 素 。 

如 果 在 一 个 程序 中 需要 处 理 一 系列 的 髓 套子 程序 调用 ， 那 么 堆栈 是 一 个 非常 有 用 的 数据 结构 。 当 
下 一 个 地 址 到 来 之 前 ， 如 果 在 进行 分 支 转移 到 下 一 个 地 址 之 前 ， 将 当前 的 地 址 压 人 堆栈 顶 ， 那么 程序 
就 可 以 沿 着 到 来 时 的 同样 的 路 径 返 回 。 接 下 来 所 要 做 的 事情 就 是 ， 在 需要 时 ， 依 次 弹出 每 个 地 址 ( 进 
行 出 栈 操作 )。 下 面 举 一 个 日 常生 活 中 的 例子 ， 假 如 我 们 按 如 下 的 顺序 访问 一 系列 的 城市 : 

1l. New York, NY 

2. Albany, NY 

3. Buffalo, NY 

4. Erie, PA 
5. Pittsburgh, PA 
6. Cleveland, OH 
7. St. Louis, MO 
8. Chicago, IL 

如 何 从 Chicago 返回 New York 呢 ? 很 简单 ， 人 们 首先 会 拿 出 一 个 地 图 (找到 一 条 更 直接 的 路 线 )， 
或 者 已 经 “知道 ”去 找到 80 号 高 速 公路 然后 一 直 向 东 行 驶 。 当 然 ， 计 算 机 并 没有 人 类 的 智能 。 所 以 计 
算 机 最 容易 做 的 事情 是 沿 着 原来 的 路 线 返 回 。 堆 栈 (类 似 于 表 A-3 所 给 出 的 ) 正 是 最 合适 做 这 项 工作 
的 数据 结构 。 计 算 机 需要 做 的 就 是 ， 在 遍历 路 线 过 程 中 ,将 当前 的 位 置 依次 压 人 堆栈 顶 。 通 过 从 堆栈 
顶 依次 弹出 原先 的 那个 城市 就 可 以 很 方便 地 找到 返回 路 线 。 


表 A-3 访问 城市 的 一 个 堆栈 














堆栈 位 置 城 市 
7 (顶部 ) St. Louis, MO 
6 Cleveland, OH 


+ 





Pittsburgh, PA 





Erie, PA 





Buffalo, NY 





Albany, NY 








Flw | 


New York, NY 





可 以 采用 各 种 不 同 的 方式 来 实现 堆栈 数据 结构 。 最 流行 的 软件 实现 方式 是 通过 线性 数组 和 链表 来 
完成 的 。 系 统 堆 栈 (堆栈 的 硬件 版 本 是 采用 一 个 固定 的 存储 器 分 配 空间 来 实现 的 ， 即 系统 为 系统 堆 
栈 留 出 一 大 块 专用 的 存储 器 空间 。 管 理 系 统 堆 栈 需 要 两 个 存储 器 变量 。 一 个 存储 器 变量 指示 堆栈 项 
〈 即 进入 堆栈 的 最 后 一 个 元 素 )， 另 一 个 存储 器 变量 对 堆栈 中 的 元 素数 目 进行 计数 。 最 大 堆栈 容量 〈 即 
堆栈 允许 的 最 高 存储 器 地 址 ) 会 作为 一 个 常数 被 存储 起 来 。 当 一 个 元 素 压 人 堆栈 后 ， 堆 栈 指针 〈 堆 栈 
项 的 存储 器 地 址 ) 会 按照 在 堆栈 中 存储 数据 类 型 的 大 小 来 进行 递增 操作 。 

现在 考虑 这 样 一 个 例子 ， 我 们 要 存储 字母 表 中 的 最 后 三 个 字母 ， 并 且 要 以 相反 的 顺序 取出 这 三 个 
字母 。 用 十 六 进 制 表示 这 些 字母 的 Java (统一 编码 ，Unicode) 编码 为 ; 

X 王 0058，Y 王 0059，Z 一 005A。 

存储 器 中 从 808A 到 80CA 的 地 址 空间 保留 给 堆栈 使 用 。 堆 栈 的 最 大 容量 为 一 个 常数 MAXSTACK， 
设置 为 20 (十 六 进 制 )。 因为 堆栈 最 初 为 空 ， 所 以 堆栈 指针 的 初 值 为 0， 堆栈 计 数 器 的 初 值 也 是 0。 表 
A-4 跟踪 记录 了 存储 这 三 个 统一 编码 字母 时 ， 堆 栈 的 状态 和 堆栈 的 管理 变量 。 
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表 A-4 添加 字母 X、Y 和 了 Z 入 堆栈 (虚线 代表 不 相关 存储 器 的 值 ) 
一 一 一 一 一 一 一 一 一 







































































存储 器 堆栈 存储 器 堆栈 存储 器 堆栈 
地 址 内 容 地 址 内 容 地 址 内 容 
8091 一 - ao91 | 一 8091 
8090 — 8090 一 8090 一 
808F | 一 808F 一 808F 00 
808E 一 808E -一 808E 5A 
808D 一 808D 00 808D 00 
808C -一 808C 59 808C [ 59 
808B 00 808B 00 808B 00 
808A 58 808A 58 808A 58 
堆栈 顶 二 808A 堆栈 项 一 808C 堆栈 项 一 808E 
a) X (0058) 压 人 堆栈 ， 堆 栈 指 b) Y (0059) 压 人 堆栈 ， 堆 栈 指 c) Z (005A) 压 人 堆栈 ， 堆 栈 指 
针 按 照 数据 元 素 的 大 小 (2 个 字 针 的 值 再 增加 2 个 字 节 。 针 的 值 青 增加 2 个 字 节 。 
节 ) 增加 。 


要 取 回 这 三 个 字母 ， 需 要 执行 三 次 出 堆栈 操作 〈 弹 出 )。 每 弹出 一 次 ， 堆 栈 指 针 的 值 就 递减 2。 当 
然 ， 每 次 增加 数据 或 取出 数据 ， 必 须要 检查 堆栈 内 部 的 状态 。 必 须 确 保 不 会 在 堆栈 满 时 向 堆栈 增加 元 
素 ， 而 不 会 在 堆栈 空 时 从 堆栈 移 走 元 素 。 在 计算 机 系统 的 硬件 和 软件 中 ， 堆 栈 都 有 广泛 的 应 用 。 


A.3 树 


队列 、 堆 栈 和 数组 对 于 处 理 一 些 事物 的 列表 是 非常 有 用 的 ， 无 论 列 表 中 有 多 少 个 元 素 ， 这 些 元 素 
在 列表 中 的 位 置 (相互 之 间 的 相对 位 置 ) 是 不 会 发 生 改 变 的 。 显 然 ， 在 日 常生 活 中 使 用 数据 收集 的 许 
多 性 质 并 不 是 如 此 。 现 在 ,我 们 考虑 一 个 管理 地 址 簿 的 程序 。 对 这 类 数据 进行 排序 的 一 种 有 用 的 方法 
是 按照 人 名 的 姓氏 顺序 来 排序 。 二 分 搜索 (binary search， 或 称 为 对 分 查找 ) 的 方法 可 以 迅速 查找 列表 
中 的 任何 一 个 名 字 ， 这 种 方法 每 次 限制 只 搜索 列表 的 一 半 。 图 A-2 说 明了 如 何 使 用 二 分 搜索 方法 ， 在 
一 些 著 名 数学 家 名 单 中 查找 名 为 Kleene 的 数学 家 。 首 先 要 决定 列表 的 中 间 位 置 (Hilbert)， 并 将 这 
个 值 与 关键 字 进 行 比较 。 如 果 它 们 相等 ， 就 找到 了 要 找 的 名 字 。 如 果 关 键 字 Kleene 比 这 个 列表 的 中 
间 位 置 的 值 大 ， 那 么 就 在 列表 底部 的 一 半 进 行 查找 ， 如 图 A-2b 所 示 。 通 过 二 分 搜索 能 够 有 效 地 减少 查 
找 空间 。 现 在 ， 我 们 在 列表 底部 那 一 半 找 到 它 的 新 的 中 间 位 置 (Markov)。 因 为 关键 字 比 这 个 新 的 中 
间 值 小 ， 所 以 我 们 应 该 在 列表 底部 一 半 的 上 半 部 分 在 进行 查找 ， 如 图 A-2c 所 示 。 如 果 仍 然 没 有 找到 关 


Boole Boole Boole Boole 
Erdos Erdos Erdos Erdos 
Euclid Euclid Euclid Euclid 
Euler Euler Euler Euiler 
Fermat Fermat Fermat Fermat 
Gauss Gauss Gauss Gauss 
Godel Godel Godel Godel 
Hilbert Hilbert Hilbert Hilbert 
Hopper Hopper Hopper [> Hopper 
Kleene Kleene Kleene Kleene 
Klein Klein Klein Fklein 
Markov Markov Markov Markov 
Newton Newton Newton Newton 
Post Post Post Post 
Riemann Riemann Riemann Riemann 
Tarski Tarski Tarski Tarski 
a) b) C) 中 


图 A-2 二 分 搜索 Kleene 
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键 字 ， 那 么 再 把 这 个 上 半 部 分 列表 进行 对 半 查 找 。 按 照 这 种 方法 ， 继 续 拆 分 列表 直到 找到 要 求 的 关键 
字 为 止 ， 或 者 证 明 这 个 关键 字 不 在 列表 中 。 设 计 这 个 例子 属于 最 坏 的 情况 。 在 这 个 有 16 个 元 素 列表 
中 ， 通 过 4 次 操作 找到 了 要 求 的 关键 字 。 如 果 碰 巧 要 查找 的 是 Hilbert， 那 么 第 一 次 操作 就 可 以 找到 。 
无 论 这 个 列表 多 人 么 大 ， 任 何 一 个 名 字 都 能 够 定位 ， 查 找 需 要 的 时 间 与 列表 中 元 素 总 数 的 以 2 为 基 的 对 
化 成 正比 。 

很 显然 ， 二 分 搜索 要 求 数据 按照 它 的 关键 字 的 值 来 进行 排序 。 当 想 要 往 地 址 德 中 增加 一 个 名 字 时 ， 
会 发 生 什么 情况 呢 ? 我 们 必须 将 这 个 新 名 字 放 到 一 个 合适 的 位 置 ， 以 便 能 够 可 靠 地 使 用 二 分 搜索 。 如 
果 地 址 簿 是 使 用 线性 数组 的 形式 存储 的 ， 那 么 可 以 非常 容易 地 计算 出 这 个 新 元 素 位 于 哪个 位 置 ， 假 设 
位 置 为 &。 但 是 ， 要 在 这 个 数组 中 插入 这 个 元 素 时 ， 就 必须 为 这 个 元 素 移出 空间 来 。 这 就 意味 着 首先 
要 将 这 个 数组 中 从 位 置 & 到 位 置 x (假设 是 地 址 簿 中 的 最 后 一 个 元 素 ) 的 所 有 数据 元 素 ， 移 动 到 & 十 1 
到 ”十 1 的 位 置 上 。 如 果 这 个 地 址 短 的 容量 比较 大 ， 则 这 种 移 位 过 程 可 能 会 比 我 们 想像 的 要 慢 。 进 一 步 
地 说 ， 如 果 这 个 数组 恰好 只 能 容纳 个 元 素 ， 那 么 这 个 问题 就 会 变 得 非常 麻烦 。 这 时 ， 必 须 定 义 一 个 
新 的 数组 ， 从 旧 的 数组 载 人 新 的 数组 ， 而 花费 更 多 的 时 间 。 

采用 链表 的 实现 方法 也 不 是 太 好 。 因 为 链表 的 中 间 位 置 很 难 找到 。 搜 索 链表 的 唯一 方法 是 追随 列 
表 中 的 元 素 链 ， 直 到 找到 新 元 素 应 该 放置 的 位 置 为 止 。 如 果 这 个 链表 非常 长 ， 线 性 搜索 在 操作 上 几乎 
是 不 可 行 的 。 搜 索 速度 非常 慢 ， 可 能 大 家 都 难以 忍受 。 

因此 ， 要 保持 顺序 性 和 可 维护 性 的 列表 ， 一 个 好 的 数据 结构 应 该 是 允许 我 们 迅速 找到 要 求 的 事项 ， 
方便 地 增加 和 删除 一 些 元 素 而 不 会 产生 过 多 的 开销 。 事 实 上 ， 有 几 种 数据 结构 就 很 适合 于 这 种 情况 。 
其 中 最 简单 的 就 是 二 又 树 (binary tree) 。 像 链表 一 样 ， 二 叉 树 通过 指向 存储 器 空间 的 指针 来 控制 邻近 
的 数据 元 素 。 并 且 ， 也 与 链表 一 样 ， 二 又 树 的 结构 可 以 生长 到 无 穷 大 。 按 照 这 种 方式 成 长 的 二 又 树 ， 
可 以 很 容易 地 从 这 棵 树 上 取 到 任意 的 一 个 关键 字 。 二 叉 树 之 所 以 称 为 二 又 (binary)， 是 因为 在 它们 的 
图 形 表示 法 中 ， 每 个 节点 (顶点 ) 最 多 只 有 两 个 分 支 (孩子 ，child) 节点。 超过 两 个 分 支 节点 的 树 称 
为 n 叉 树 (n-ary trees)。 一 些 二 叉 树 的 例子 如 图 A-3 所 示 。 这 些 图 形 看 起 像 是 一 些 倒 长 的 树 ， 不 必 奇 
怪 ， 它 们 都 是 数学 意义 上 的 树 。 二 叉 树 的 每 个 节点 都 连接 到 这 种 图 形 上 ， 这 意味 着 每 个 节点 都 可 以 从 
第 一 个 节点 到 达 。 而 且 ， 这 种 图 形 并 没有 包含 环 (cycle)， 也 就 是 说 在 二 义 树 上 搜索 时 ， 不 会 以 循环 
结束 。 


a) b) C) 


O 


图 A-3 一 些 二 叉 树 

树 的 最 顶层 的 节点 叫做 树 根 〈root) 。 树 根 只 是 树 的 一 部 分 ， 树 根 必须 是 独立 的 。 其 他 所 有 节点 都 
可 以 通过 树 根来 引用 。 访 问 节点 的 方法 是 利用 存储 在 每 个 节点 的 两 个 存储 器 指针 的 值 。 每 个 指针 都 指 
示 在 哪里 可 以 找到 该 节点 的 左 子 节点 或 右 子 节点 。 树 的 叶子 〈leaves)， 就 是 树 结构 的 最 底 端 节点 ， 它 
们 的 孩子 节点 都 是 空 〈0) 值 。 从 树 根 到 叶子 之 间 的 距离 ， 也 就 是 层 (level) 的 数 日 ， 称 之 为 树 的 高 度 
(height) 。 那 些 不 是 叶子 的 节点 称 为 树 的 内 部 节点 (internal node， 或 称 为 中 间 节 点 ) 。 内 部 节点 至 少 有 
一 模子 树 (subtree) ， 即 使 这 棵 子 树 是 一 片 叶子 。 

除了 指针 外 ， 二 叉 树 的 节点 周围 还 包含 数据 (或 者 是 数据 的 关键 字 的 值 );， 这 些 数据 组 成 了 树 的 结 
构 。 二 叉 树 的 组 织 结构 通常 是 把 所 有 小 于 某 个 特定 节点 的 关键 字 值 的 关键 字 值 都 存储 在 这 个 节点 的 左 
子 树 上 ， 而 所 有 大 于 或 等 于 某 个 特定 节点 关键 字 值 的 关键 字 值 都 存储 在 这 个 节点 的 右 子 树 上 。 这 种 思 
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想 的 例子 如 图 A-4 所 示 。 

图 A-4 所 示 的 二 叉 树 也 是 一 种 平衡 的 (balanced) 二 叉 
树 。 从 形式 上 来 看 ， 如 果 一 棵 二 叉 树 是 一 棵 平衡 的 二 叉 树 ， 
那么 每 个 节点 的 左 子 树 和 右 子 树 的 深度 的 差别 最 多 为 1。 这 
一 点 的 重要 意义 在 于 ， 这 颗 树 所 引用 的 任何 数据 项 都 可 以 被 
定位 ， 查 找 需要 的 时 间 和 树 中 节点 数 的 2 的 对 数 成 正比 。 因 
此 ， 在 一 棵 包含 65535 个 数据 关键 字 的 树 中 查找 某 个 特定 的 
元 素 (或 者 证 明 在 树 中 找 不 到 这 个 元 素 ) 最 多 需要 15 次 的 存 
储 器 操作 。 与 存储 在 线性 数组 中 的 分 类 链表 不 同 (这 里 ,每 。 图 A-4 按照 不 减少 的 关键 字 值 排序 
次 搜索 都 需要 相同 的 运行 时 间 )， 在 二 又 树 中 保持 这 组 关键 的 一 又 树 
字 的 值 会 变 得 非常 容易 。 要 插入 一 个 元 素 ， 只 需 重新 安排 一 些 存储 器 指针 ， 而 不 是 重 构 整个 列表 。 在 
平衡 的 二 叉 树 中 插入 和 删除 一 个 节点 的 运行 时 间 都 是 与 树 中 节点 数 的 2 的 对 数 成 正比 。 因 此 ， 对 于 维 
护 一 组 分 类 数据 元 素 ， 这 种 数据 结构 比 数组 或 简单 的 链表 更 好 。 

虽然 我 们 的 图 形 对 于 形成 树 的 逻辑 结构 的 概念 非常 方便 ， 但 是 需要 记 住 计算 机 的 存储 是 线性 的 ， 
因此 这 里 的 图 像 只 是 一 种 抽象 的 概念 。 在 表 A-5 中 ， 给 出 了 存储 图 A-4 的 树 的 64 字 节 的 存储 器 映射 方 
式 。 为 了 便于 阅读 ， 这 里 采用 了 表格 形式 。 例如， 位 于 列 5 (标号 为 5 的 列 ) 和 行 1 (标号 为 1 的 行 ) 
的 字 节 的 十 六 进 制 地 址 是 15。 行 0 列 0 所 指 的 是 地 址 0。 节 点 的 关键 字 是 十 六 进 制 的 ASCII 编码 ， 这 
些 编码 的 值 在 存储 器 映射 表 的 上 方 表 中 给 出 。 


表 A-5 图 A-4 中 的 二 叉 树 的 存储 器 映射 
字符 (关键 字 值 ) ASCII 编码 (十 六 进 制 ) 字符 (关键 字 值 ) ASCII 编码 (十 六 进 制 》 












































这 里 的 存储 器 映射 中 ， 树 根 位 于 地 址 36 到 38 ( 行 3， 列 6 一 8)。 它 的 关键 字 的 值 的 地 址 为 37。 树 
根 的 左 子 树 (孩子 ) 的 地 址 为 25 ， 右 子 树 的 地 址 为 3B。 如 果 我 们 看 地 址 3B， 会 发 现 这 个 关键 字 1, 它 
的 左 子 树 位 于 地 址 14， 右 子 树 位 于 地 址 21。 在 地 址 为 21 的 位 置 ， 会 找到 叶子 节点 J， 它 的 两 个 孩子 指 
针 都 是 0。 

二 叉 树 在 许多 应 用 中 都 是 十 分 有 用 的 ， 例 如 在 编译 器 和 汇编 程序 中 〈 参 考 第 8 章 )。 然 而 ， 当 谈 到 
要 从 大 型 数据 集中 存储 和 取 回 关键 字 值 的 时 候 ， 有 几 种 数据 结构 要 优 于 二 叉 树 。 例 如 ， 考 虑 一 个 为 
800 万 人 口 的 纽约 市 设计 在 线 电话 簿 的 任务 。 假 定 电话 本 里 大 约 有 800 万 个 电话 号 码 ， 那 么 采用 二 叉 
树 则 最 少 要 需要 23 层 。 而 且 ， 至 少 有 一 半 以 上 的 节点 在 树 的 叶子 上 。 这 意味 着 大 多 数 情况 下 ， 在 找到 
要 求 的 电话 号 码 之 前 ， 我 们 必须 要 读 取 指针 多 达 22 次 。 

虽然 二 又 树 的 设计 并 不 是 完全 不 适合 这 种 应 用 ， 但 是 我 们 可 以 对 它 进行 改进 。 一 个 比较 好 的 方式 
是 使 用 一 个 二 叉 树 结构 ， 叫 做 trie 〈 发 音 为 “try”) 。?7 叉 树 结构 并 不 是 在 每 个 节点 上 存储 整个 的 关键 
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字 ，tries 使 用 关键 字 的 分 段 技术 。 在 沿 着 这 个 trie 的 搜索 过 程 中 ， 关 键 字 的 值 被 组 合 安装 起 来 。 内 部 
节点 包含 足够 的 指针 数 来 指引 搜索 查找 所 要 求 的 关键 字 ， 或 者 是 到 trie 的 下 一 层 去 。? 叉 树 结构 特别 
适合 于 具有 可 变 长 度 关键 字 的 数据 ， 例 如 ， 电 话 德 的 例子 。 在 n 叉 树 的 结构 中 ， 较 短 的 关键 字 位 于 靠 
近 顶 层 ， 而 较 长 的 关键 字 位 于 数据 结构 的 底部 。 

在 网 A-5 中 ,描述 了 一 个 包含 著名 数学 家 名 字 的 n 叉 树 结构 。 这 个 图 中 的 每 个 内 部 节点 都 包含 
26 个 字母 。 这 种 数据 的 性 质 表明 ， 还 可 以 有 一 些 比 图 中 给 出 的 结构 更 有 效率 的 n 叉 树 结构 。 我 们 发 
现 ， 要 找到 名 字 以 ZQX 开头 的 著名 数学 家 是 非常 困难 的 。 事 实 上 ,设计 内 部 节点 的 结构 是 n 叉 树 结 
构 中 最 难 的 一 部 分 。 这 里 使 用 关键 字 的 值 作为 一 个 索引 ， 而 不 是 采用 一 个 字符 。 例如， 不 采用 包含 
字母 表 中 的 所 有 字母 作为 一 个 单一 单元 ， 而 是 对 字母 进行 分 组 。 在 改变 图 A-5 中 的 n 叉 树 结 构 的 根 
节点 的 关键 字 的 多 样 性 后 ， 这 个 树 会 变 矮 ( 压 扁 ) 一 层 。 这 种 修改 后 的 结构 如 图 A-6 所 示 。 如 果 仔 
细 进 行 平整 ,那么 这 颗 树 变 平 的 结果 会 使 得 搜索 的 速度 更 快 。 在 图 A-6 中 ， 在 树 根 中 只 选择 两 个 组 
合 的 关键 字 (ER 和 EU) 来 减少 一 层 结构 。 如 果 将 每 个 关键 字 都 加 倍 的 话 ， 则 树 根 将 会 包含 676 个 
关键 字 (从 AA 到 ZZ)。 这 相对 于 所 存储 的 数据 来 说 ， 会 使 得 这 种 数据 结构 变 得 不 必要 的 庞大 和 难 
以 处 理 。 
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图 A-5 一 个 包含 著名 数学 家 名 字 的 n 叉 树 结构 
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图 A-6 一 个 较 平 的 著名 数学 家 名 字 的 n 叉 树 结构 树 

实际 上 ， 对 于 大 量 数 据 的 存储 和 检索 ， 结 构 设 计时 更 多 考虑 的 是 数据 存储 的 介质 ， 而 不 是 数据 本 
身 的 性 质 。 通 常 ， 人 们 会 精心 设计 树 的 索引 节点 ， 以 便 通 过 对 存储 索引 的 磁盘 驱动 器 的 一 次 读 操 作 ， 
就 可 以 访问 位 于 树 的 某 一 层 的 内 部 节点 的 某 些 整数 。 其 中 一 种 数据 结构 就 是 B 十 树 ， 它 通常 在 大 型 数 
据 库 系统 中 使 用 。 

B 十 树 (B 十 tree) 是 一 种 由 指示 索引 结构 或 者 实际 数据 记录 的 指针 构成 的 分 层 体系 结构 。 当 
从 数据 库 中 增加 或 删除 记录 时 ， 需 要 更 新 B 十 树 的 叶子 节点 。 当 不 可 能 更 新 现 有 的 叶子 节点 时 ， 
就 要 增加 内 部 节点 。B 十 树 的 内 部 节点 的 集合 被 称 为 索引 部 分 (index part) ， 而 叶子 节点 被 称 为 顺 
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序 部 分 (sequence part) ， 因 为 叶子 节点 总 是 按照 大 小 次 序 排列 的 。 一 个 B 十 树 的 局 部 示意 图 如 A-7 
所 示 。 
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图 A-7 一 个 B 十 树 的 局 部 


图 中 显示 的 数字 是 记录 关键 字 的 值 。 连 同 B 十 树 的 叶子 节点 中 的 每 个 关键 字 的 值 ， 数 据 库 管理 系 
统 (参考 第 8 章 ) 会 为 这 些 物理 记录 的 存储 位 置 都 提供 一 个 指针 。 操 作 系 统 会 使 用 这 个 指针 值 来 从 磁 
盘 中 读 取 记录 。 实 际 上 物理 记录 可 以 位 于 存储 系统 的 任何 位 置 ， 但 是 数据 结构 的 顺序 部 分 总 是 按 次 序 
存放 的 。 对 B 十 树 进行 遍历 可 以 确保 我 们 根据 记录 的 关键 字 的 值 迅速 找到 任何 的 记录 。 

要 使 用 图 A-7 中 的 B 十 树 来 定位 一 个 关键 字 的 值 ， 只 需要 将 要 查找 的 关键 字 的 值 与 存储 在 内 部 节 
点 的 值 进行 比较 。 如 果 所 求 的 关键 字 的 值 比 内 部 节点 的 一 个 关键 字 的 值 小 ， 则 这 颗 树 就 从 左边 遍历 。 
相应 地 ， 如 果 所 求 的 这 个 关键 字 的 值 大 于 或 等 于 内 部 节点 的 关键 字 的 值 ， 则 往 右边 遍历 这 颗 树 。 当 一 
个 内 部 节点 已 经 达到 其 最 大 容量 ， 还 需要 向 数据 库 中 增加 记录 时 ， 就 需要 往 这 种 层次 结构 中 添加 附加 
的 层次 。 然 而 ， 记 录 删 除 时 ， 并 不 会 立即 造成 树 被 平整 〈 压 扁 )， 而 仅仅 是 指针 发 生 一 个 位 移 。B 十 树 
的 层次 结构 被 平整 化 的 过 程 叫做 数据 库 重 组 (database reorganization， 或 reorg)。 在 大 型 数据 库 中 ， 
重组 可 能 是 非常 耗 时 的 ， 因 此 通常 只 是 在 绝对 必须 的 情况 下 才 执 行 这 种 操作 。 

最 佳 的 数据 库 检 索 方 法 必须 考虑 数据 库 运行 系统 的 体系 结构 。 特 别 地 ， 最 佳 的 系统 性 能 ， 一 定 要 
保持 磁盘 读 操作 的 次 数 为 最 小 值 (参考 第 10 章 ) 。 如 果 一 个 数据 文件 索引 的 实质 部 分 没有 被 存放 在 存 
储 器 的 高 速 缓存 中 ， 那 么 访问 记录 至 少 需要 两 次 读 操作 : 一 次 是 读 电 索引 ， 另 一 次 是 肥 回 记录 。 对 于 
B 十 树 索引 中 频繁 使 用 的 文件 ， 树 的 前 几 层 都 从 高 速 缓存 存储 器 中 读 取 ， 而 不 是 从 磁盘 中 读 取 。 这 样 ， 
只 有 当 检 索索 引 较 低 的 树 结构 层次 和 数据 记录 本 身 时 ， 才 需要 读 取 磁 盘 。 


A.4 网 络 图 


根据 定义 ， 树 结构 不 包含 环 。 对 于 数据 存储 和 检索 来 说 ， 树 结构 是 非常 有 用 的 。 当 然 ， 按 照 计 
算 的 复杂 性 来 说 ， 这 也 是 一 项 比较 简单 的 任务 。 很 明显 ， 处 理 一 些 困 难 的 问题 要 求 采 用 更 加 复杂 的 
结构 。 例 如 ， 考 虑 在 A. 2 节 中 提出 的 行程 安排 问题 ， 需 要 找到 一 条 从 Chicago 到 New York 的 返回 路 
径 。 在 那里 ， 我 们 并 没有 讨论 寻找 最 短 返 回路 径 的 问题 ， 而 只 是 采用 了 最 简单 的 方法 ， 简 单 地 按 原 
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路 返回 。 要 寻找 最 短路 径 ， 或 者 是 最 优 路 径 ， 就 要 求 使 用 一 种 不 同类 型 的 数据 结构 ， 允 许 有 环 的 数 
据 结 构 。 

n 叉 树 可 以 变 成 一 个 更 普遍 的 网 络 图 ， 只 要 允许 叶子 节点 相互 指向 连接 。 但 是 现在 要 考虑 是 这 样 
的 一 个 事实 : 任何 一 个 节点 都 可 能 指向 图 中 其 他 n 一 1 个 节点 。 如 果 简单 地 讨论 从 二 叉 树 数据 结构 来 构 
建 一 个 网 络 数据 结构 ， 那 么 每 个 节点 将 需要 ”一 1 个 指针 。 当 然 ， 我 们 可 以 做 得 更 好 一 些 。 

如 果 所 讨论 的 网 络 是 静态 的 ， 也 就 是 说 ， 在 算法 的 执行 过 程 中 网 络 既 不 会 增加 也 不 损失 节点 ， 则 
可 以 使 用 邻接 算 阵 (adjacency matrix) 来 表示 。 邻 接 矩 阵 就 是 一 个 二 维 数组 ， 每 个 节点 都 具有 相应 的 
行 和 列 。 考 虑 一 个 如 图 A-8a 所 示 的 网 络 图 。 它 有 6 个 相互 连接 的 节点 。 图 中 节点 之 间 的 连接 ( 称 为 
边 ，edge) 在 邻接 矩阵 中 用 1 来 表示 。 在 邻接 和 矩阵 中 ， 将 1 放置 在 一 个 节点 的 列 以 及 与 它 相连 的 节点 
的 行 的 交叉 位 置 上 。 完 成 的 邻接 矩阵 如 图 A-8b 所 示 。 





a) 一 个 网 络 图 b) 网 络 图 的 邻接 矩阵 
图 A-8 网 络 图 

现在 ， 让 我 们 回 到 在 两 个 城市 之 间 找 到 一 个 优化 路 径 的 例子 。 首 先 把 城市 连接 地 图 表示 成 一 个 带 
有 权 值 (weighted) 边 的 图 。 这 些 边 的 权 值 代表 了 城市 之 间 的 相应 距离 ， 或 者 是 从 城市 之 间 往 返 的 费 
用 。 在 这 里 ,不 是 把 一 些 1 放 到 邻接 矩阵 中 ， 而 是 在 两 个 城市 之 间 存 在 的 通行 路 径 的 位 置 标注 旅行 所 
需 的 费用 。 

我 们 也 可 以 把 一 个 连接 图 表示 成 一 个 链接 的 邻接 列表 〈adjacency list) 。 要 实现 一 个 邻接 列表 结构 
通常 使 用 一 个 用 线性 数组 来 保存 图 中 的 各 个 节点 ， 线 性 数组 会 指示 节点 之 间 的 连接 方式 。 这 个 排列 的 
好 处 是 可 以 非常 容易 地 找到 图 中 的 任何 一 个 节点 ， 而 且 在 一 个 节点 到 另 一 个 节点 之 间 的 旅行 费用 也 可 
以 与 数组 中 的 列表 元 素 一 起 标示 出 来 。 一 个 带 有 权 值 的 网 络 图 和 相应 的 邻接 列表 的 数据 结构 如 图 A-9 
所 示 。 





a) 带 有 权 植 的 网 络 图 b) 网 络 图 的 邻接 列表 
图 A-9 网络 图 


正如 上 面 所 述 ， 这 些 普 遍 的 网 络 图 广泛 应 用 于 解决 通信 路 由 的 问题 。 这 些 算法 中 ， 其 中 最 重要 的 
算法 是 Dijkstra 算法 。Dijkstra 算法 的 思想 是 通过 由 所 有 节点 之 间 的 所 有 最 短 的 连接 组 成 的 网 络 图 中 计 
算出 最 低 费用 的 路 径 。 这 种 算法 会 首先 检查 图 与 起 始 节点 相 邻 的 所 有 路 径 ， 并 且 利用 从 起 始 节点 到 达 
各 个 节点 的 费用 更 新 每 个 节点 的 值 。 接 着 会 检查 通 往 相连 节点 的 每 个 路 径 ， 并 且 使 用 到 达 该 节点 的 费 
用 更 新 这 些 相连 节点 的 值 。 如 果 这 个 节点 中 已 经 包含 了 一 个 费用 值 ， 那 么 只 有 当 从 起 始 节点 到 达 该 节 
点 的 旅行 费用 小 于 已 经 记录 在 这 个 节点 的 值 的 情况 下 ， 才 会 把 这 个 节点 选 为 下 一 个 目的 节点 。 这 个 过 
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程 如 图 A-10 所 示 。 





图 A-10” Dijkstra 算法 


图 A-10a， 先 把 到 达 所 有 节点 的 值 设置 为 无 穷 大 。 然 后 检查 从 第 1 个 节点 到 相 邻 节点 之 间 的 路 径 ， 
并 且 用 到 达 节 点 的 费用 更 新 每 个 节点 的 值 ， 参 见 图 A-10b。 接 着 再 检查 从 最 小 值 节点 到 其 相 邻 节点 之 
间 的 路 径 ， 如果 从 第 一 个 节点 到 达 相 邻 节点 的 费用 值 比 先前 存储 在 每 个 节点 的 值 小 ， 那 么 就 用 这 个 较 
小 的 费用 更 新 这 些 相 邻 节点 的 值 。 这 就 是 图 A-10c 的 左 侧 边 节点 上 所 发 生 的 情况 。 重 复 这 个 过 程 直到 
找到 最 短 的 路 径 ， 如 图 A-10f 所 示 。 

Dijkstra 算法 中 比较 棘手 的 部 分 要 涉及 到 大 量 的 数据 结构 。 算 法 不 仅 需 要 提供 这 种 网 络 图 本 身 ， 而 
且 还 必须 以 某 种 方式 来 记录 每 个 节点 的 路 径 ， 以 便 在 需要 时 可 以 读 取 。 这 里 留 给 读者 作为 一 个 练习 ， 
表示 所 要 求 的 数据 结构 以 及 在 数据 结构 上 运算 Dijkstra 算法 构建 伪 代 码 。 


小 结 


本 附录 描述 了 几 种 重要 的 计算 机 系统 中 最 常 使 用 的 数据 结构 。 堆 栈 和 队列 是 系统 最 低层 结构 中 最 重要 
的 数据 结构 ， 这 些 数 据 结 构 的 简单 性 正好 与 发 生 底层 的 简单 操作 相 匹配 。 在 系统 软件 层次 上 ， 编 译 器 和 数 
据 库 系统 主要 依赖 于 树 型 数据 结构 来 实现 更 快 的 信息 存储 和 检索 。 最 复杂 的 数据 结构 都 是 应 用 于 高 级 语言 
的 层次 。 这 些 复杂 的 数据 结构 可 以 由 多 个 附属 的 〈 子 ) 数据 结构 组 成 。 正 如 本 附录 中 所 介绍 的 ， 需 要 同时 
使 用 数组 和 链表 才能 完整 描述 网 状 图 。 
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深入 阅读 


很 好 地 学 习 和 理解 这 个 简要 的 附录 中 所 讨论 的 内 容 ， 对 于 继续 学 习 计算 机 系统 和 编程 方法 是 十 分 必要 
的 。 如 果 读 者 是 第 一 次 学 习 这 种 数据 结构 ， 那 么 建议 大 家 阅读 Rawlins (1992) 的 有 关 算 法 的 著作 。 本 书 组 
织 合 理 、 生 动 有 趣 和 具有 丰富 的 内 容 。 对 于 有 兴趣 进行 深入 学 习 和 提高 的 读者 ，Knuth (1998)， 以 及 Cor- 
men、Leiserson、Rivest 和 Stein (2001) 的 著作 都 提供 了 更 加 详细 的 内 容 。 另 外 ，Weiss (1995) 、Horowi- 
tz 和 Sahni (1983) 的 书籍 则 比较 简洁 和 易于 理解 ， 内 容 也 都 包含 了 本 附录 中 所 描述 的 各 种 重要 的 数据 
结构 。 
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练习 题 


1. 对 于 下 面 的 各 种 数据 结构 ， 至 少 举 出 一 个 最 适合 的 应 用 例子 : 
a) 数组 
b) 队列 
c) 链表 
d) 堆栈 
e) 树 

2. 正如 本 附录 中 所 介绍 的 ， 优 先 级 队列 也 是 一 个 队列 。 如 果菜 些 元 素 满足 特定 的 条 件 ， 那 么 优先 级 队列 就 
允许 这 些 元 素 跳 到 队列 的 头 部 。 请 设计 一 个 数据 结构 和 一 种 合适 的 算法 来 实现 优先 级 队列 。 

. 假如 你 不 想 使 用 树 型 数据 结构 来 保存 一 组 分 类 数据 元 素 ， 那 么 可 以 选择 链表 来 实现 。 很 明显 ， 链 表 方 法 
的 效率 非常 低 。 这 个 列表 是 按 关键 字 的 值 的 递增 顺序 进行 排列 的 。 也 就 是 说 ， 最 小 关键 字 的 值 排 在 列表 
的 开始 位 置 。 为 了 定位 查找 某 个 数据 元 素 ， 必 须要 按 顺 序 搜索 这 个 列表 直到 找到 一 个 关键 字 的 值 比 要 求 
的 关键 字 的 值 大 为 止 。 如 果 搜 索 的 目的 是 向 这 个 列表 中 插入 另 一 个 元 素 ， 那 么 如 何 完成 这 个 插入 过 程 ? 
换 句 话说 ,编写 一 种 伪 代 码 算法 列 出 每 一 步 过 程 。 还 可 以 通过 稍微 改变 这 个 列表 的 数据 结构 来 使 这 种 算 
法 更 高 效 。 

4. 下 面 是 一 个 二 叉 树 的 存储 器 映射 表 。 请 面 出 这 棵 树 。 


CA 
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5. 下 面 是 一 个 二 叉 树 的 存储 器 映射 表 。 请 画 出 这 棵 树 。 

















6. 下 面 是 一 个 二 叉 树 的 存储 器 映射 表 。 这 果树 的 叶子 节点 包含 的 关键 字 为 : H (48), I (49), J 
(4A), K (4B)，L (4C), M (4D)，N (4E) 和 QO (4F)。 请 画 出 这 棵 树 。 





























7. 发 明 一 个 公式 计算 可 以 放 到 一 个 n 层 的 二 叉 树 中 的 最 大 的 节点 数目 。 

8. 图 的 遍历 就 是 询问 (访问 ) 图 中 每 一 个 节点 的 过 程 。 当 以 某 种 顺序 (也 可 能 无 序 ) 向 树 中 增加 节点 
和 以 某 种 其 他 的 顺序 检索 节点 时 ， 遍 历 是 非常 有 用 的 。 下 图 中 显示 了 三 种 常用 的 遍历 方式 ， 分 别 是 
前 序 (preorder) 遍历 、 中 序 (inorder) 遍历 和 后 序 (postorder) 遍历 。 其 中 ，a 图 表示 前 序 遍 历 ， 
b 图 表示 中 序 遍 历 ，c 图 表示 后 序 遍 历 。 






b) 
ABCDEFGHU 


a) 重新 排列 上 面 的 树 ， 使 得 在 前 序 遍 历 过 程 中 可 以 按照 字母 表 的 顺序 打印 出 节点 关键 字 的 值 。 只 改 
变节 点 中 的 关键 字 的 值 ， 对 于 中 序 遍 历 也 实现 同样 的 要 求 。 
b) 对 在 a 部 分 中 重 画 的 两 棵 树 来 实现 其 他 两 种 遍历 。 
9. 大 部 分 有 关 算 法 和 数据 结构 的 书籍 都 提出 遍历 算法 就 是 递归 过 程 。 (递归 过 程 是 调用 自己 的 子 程序 
或 函数 .) 然而 ， 计 算 机 是 使 用 和 迭代 法 来 完成 这 种 递归 过 程 的 ! 下 面 的 这 个 算法 是 使 用 一 个 堆栈 来 
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完成 树 的 一 种 迭代 的 前 序 遍 历 〈 参 考 上 一 题 )。 当 每 个 节点 被 遍历 时 ， 会 像 上 面 的 图 一 样 打印 出 它 
的 关键 字 的 值 。 
ALGORITHM Preorder 
TreeNode : node 
Boolean : done 
Stack: stack 
Node 4 一 root 
Done 人 久 FALSE 
WHILE NOT done 
WHILE node NOT NULL 
PRINT node 
PUSH node onto stack 
node € left child node pointer of node 
ENDWHILE 
IF stack is empty 
done € TRUE 
ELSE 
node ¢€- POP node from stack 
node ¢- right child node pointer of node 
ENDIF 
ENDWHILE 
END Preorder 


a) 修改 这 个 算法 ， 让 程序 可 以 实现 中 序 遍 历 。 
b) 修改 这 个 算法 ,让 程序 可 以 实现 后 序 遍历 提示 当 离 开 一 个 节点 去 沿 着 它 的 左 子 树 而 行 时 ， 更 
新 这 个 节点 的 值 表示 这 个 节点 已 经 被 访问 过 ) 。 
10. 考虑 图 A-6 中 的 nn 叉 树 的 根 节 点 ， 如 果 发 现 一 个 名 叫 Ethel 的 著名 数学 家 ， 将 会 出 现 什 么 样 的 复杂 
情况 ? 应 该 如 何 防止 这 类 问题 发 生 ? 
11, 使 用 Dijkstra 算法 ， 寻 找 一 条 从 New York 到 Chicago 的 最 短路 径 ， 使 用 下 面 的 邻接 矩阵 中 所 给 出 
的 里 程 。 值 为 “无 穷 大 〈ce)” 表 示 在 给 定 的 两 个 城市 之 间 没 有 直接 的 连接 。 


奥 尔 巴 尼 | 





















































12. 构思 一 种 ， 在 存储 邻接 矩阵 时 可 以 占用 更 小 的 主 存储 器 空间 的 方案 。 
13. 设计 一 种 具有 适合 的 数据 结构 的 算法 ， 来 实现 Dijkstra 算法 。 
14. 本 附录 中 哪 种 数据 结构 最 适合 用 来 创建 字典 〈 这 个 字典 将 作为 一 个 字 处 理 器 中 的 拼写 检查 器 )? 





术 语 表 

1s Complement Notation; 参见 One's Complement Notation ( 反 码 表示 法 )。 

2s Complement Notation: 参见 Two's Complement Notation 〈 补 码 表示 法 ) 。 

Access Time 〈 存 取 时 间 ):， (1) 硬盘 的 旋转 延迟 和 寻 道 时 间 的 总 和 。 (2) 从 磁盘 或 存储 器 上 找到 
和 返回 要 求 信 息 所 需要 的 时 间 。 

Accumulator Architecture (累加 器 体系 结构 ): 该 体系 结构 假定 了 一 个 操作 数位 于 累加 器 中 ， 指 令 中 
无 需 显 式 地 引用 累加 器 。 

ACID Properties (ACID 特性 )， 数据 库 系统 或 事务 处 理 系统 的 4 个 特点 。(1) 原子 性 : 所 有 相关 的 
更 新 或 者 在 事务 的 范围 内 发 生 ， 或 者 根本 就 不 发 生 更 新 ; (2〉 一致 性 : 所 有 的 更 新 都 要 满足 对 全 部 数 
据 元 素 设置 的 限制 ，(3) 隔离 性 ; 事务 不 能 干涉 其 他 事务 的 活动 或 更 新 ;， (4) 持久 性 : 成 功 的 事务 要 
尽 可 能 快 地 写 人 到 “持久 性 ”的 介质 上 (如 磁盘 )。 

Actuator Arm (磁头 辟 ): 保持 读 / 写 头 的 磁盘 驱动 器 的 机 械 设备 。 

Addend (加 数 ) : 在 算术 加 法 运算 中 ， 加 数 与 被 加 数 的 值 相 加 构成 算术 求 和 。 

Address Binding (地 址 绑 定 ) : 将 符号 地 址 映射 到 实际 的 物理 存储 器 的 过 程 。 

Address Bus (地 址 总 线 ): 微 处 理 器 读 或 写 操作 时 传送 地 址 的 总 线 部 分 。 

Address Spoofing (地 址 欺骗 )， 一 种 黑客 攻击 技术 ， 邑 一 台 主 机 使 用 非法 的 假 IP 地 址 与 另 一 台 主 
机 进行 通信 。IP 欺骗 常常 用 来 破坏 用 来 防止 外 部 用 户 人 侵 企 业内 部 互连网 的 过 滤 路 由 器 和 防火 墙 。 

Addressing Mode( 寻 址 模式 ): 通过 对 操作 数 的 解释 方式 ,说 明 指 令 的 操作 数 的 存放 位 置 。 

Adjacency List (邻接 列表 ) : 一 种 建 模 有 向 图 形 (或 网 络 ) 的 数据 结构 ， 使 用 节点 元 素 之 间 的 指针 
来 显示 图 中 两 个 节点 之 间 路 径 的 存在 。 

Adjacency Matrix (邻接 矩阵) ， 一 种 建 模 有 向 图 形 (或 网 络 ) 的 二 维 数组 。 如 果 这 个 图 包含 1 个 节 
点 ， 那么 邻接 矩阵 将 有 行 和 nn 列 。 如 果 图 中 节点 z 和 节点 y 之 间 有 路 径 存 在 ， 那 么 在 邻接 和 矩阵 z 列 
2 行 处 将 包含 一 个 非 0 值 。 反 之 ， 相 应 的 位 置 为 0。 

Aggregatable Global Unicast Address Format (可 聚集 的 全 局 统一 地 址 格式 ): 在 IPv6 下 可 能 构成 
2128 个 主机 地 址 的 一 种 方案 。 

AGP，Accelerated Graphics Port (加 速 图 形 端口 ); Intel 公司 为 3D 图 形 专门 设计 的 一 种 图 形 端 口 。 

Algebraic Field (代数 域 ) : 具有 单位 元 素 的 一 组 数 ， 在 加 法 和 乘法 两 种 运算 中 是 封闭 的 。 域 还 满足 
代数 的 结合 率 、 交 换 率 和 分 配 率 。 实 数 系统 是 一 个 域 。 

Amdahl's Law (Amdahl 定律 ): 这 个 定律 前 述 了 改进 方法 特性 的 使 用 量 限制 了 系统 性 能 的 提高 。 
更 正式 好说， 计算 机 系统 的 整体 加 速率 取决 于 特定 部 件 的 加 速率 和 该 部 件 在 系统 中 的 使 用 率 。 用 公式 
表示 为 ，S 二 1 二 【1 一 了) 十 {二 k]，S 表示 加 速率 ，f 表示 较 快 部 件 完成 的 工作 部 分 ，k 表示 新 设备 的 
加 速率 。 

American National Standards Institute (美国 国家 标准 化 组 织 )， 一 个 代表 美国 利益 的 制定 计算 机 行业 
标准 的 国际 性 组 织 。 

American Standard Code for infiormation Interchange (美国 信息 交换 标准 代码 ): 参见 ASCII。 

Analytical Engine (分 析 机 ) ，1833 年 由 Charles Babbage 设计 的 一 种 通用 计算 机 器 。 

Anycasting ( 泛 播 )， 一 种 网 络 消息 的 发 送 方式 ， 它 允许 任何 一 组 逻辑 节点 接收 消息 ， 在 消息 中 并 
不 指定 特定 的 接收 器 。 

Aperture Gril，AG 《〈 柚 格式) ， 荫 音 〈 使 用 一 种 精细 的 金属 网 孔 ) 的 一 种 代替 品 ， 在 CRT 显像管 
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中 ， 利 用 一 些 细 长 金属 带 迫 使 电子 束 照 射 荧光 屏 的 正确 部 位 。 

Arithmetic Coding (算术 编码 ) :一 种 数据 压缩 的 方法 ， 利 用 一 组 被 压缩 消息 的 符号 的 概率 在 0 和 1 
间隔 内 来 分 割 实数 轴 。 出 现 概率 较 高 的 符号 得 到 较 大 的 间隔 段 。 

Arithmetic Logic Unit，ALU (算术 逻辑 单元 ): 组 合 电路 负责 完成 CPU 中 的 算术 和 逻辑 功能 。 

Arithmetic Mean (算术 平均 值 ): 一 种 集中 趋势 的 测量 方法 ， 利 用 一 组 数据 值 的 和 再 除 以 数据 值 的 
个 数 就 得 到 了 算术 平均 值 。 在 通常 使 用 中 ， 对 一 组 数值 到“ 平均 ”就 是 这 些 值 的 算术 平均 值 。 

ARPAnet: 参见 DARPAnet。 

ASCII，American Standard Code for Information Interchange (美国 信息 交换 标准 代码 )， 

使 用 7 位 字符 编码 来 表示 数字 、 字 符 、 特 殊 格 式 字 符 和 控制 符 。 

Assember Directive (汇编 指令 ): 专门 用 于 汇编 程序 的 一 种 特殊 指令 ， 这 种 指令 不 能 被 译 成 机 器 代 
码 ， 但 是 可 以 通知 汇编 程序 去 完成 一 个 特定 的 功能 ， 例 如 在 一 个 程序 清单 中 产生 一 个 分 页 符 。 

Assembly Language〈 汇 编 语言 ): 使 用 助 记 符 的 低级 语言 ， 对 于 特定 体系 结构 汇编 语言 和 机 器 语言 
存在 着 一 一 对 应 的 关系 。 

Associative Memory 关联 存储 器 ) : 按照 内 容 而 不 是 按照 地 址 来 寻 址 的 存储 器 ， 主 要 是 为 了 进行 并 
行 搜索 而 专门 设计 的 存储 器 。 

Asynchronous Circuits (异步 电路 ): 只 要 有 任何 输入 值 的 变化 就 会 激活 的 时 序 电路 。 

Asynchronous Transfer Mode (异步 传输 模式 )， 参 见 ATM。 

AT Attachment (AT 附属 设备 ) : 参见 EIDE。 

ATAPI，AT Attachment Packet Interface (AT 附属 包 接 口 )，AT 附属 包 接口 的 缩写 ， 支 持 CR-ROM 
驱动 器 的 EIDE 扩展 。 

ATM，Asynchronous Transfer Mode (异步 传输 模式 )， 一 种 数字 网 络 技术 ,采用 固定 长 度 的 单元 或 
信息 包 在 同一 网 络 上 传输 数据 、 音 频 和 视频 。 

Attenuation (衰减 )， 电 信号 随时 间 和 距离 发 生 的 损耗 ， 可 能 会 在 接收 方 导致 错误 的 数据 。 

Augend (被 加 数 ) : 参见 addend。 

B+ Tree (B 十 树 ) ;一 种 非 循环 的 数据 结构 ， 由 索引 结构 的 指针 或 数据 记录 组 成 。B 十 树 的 内 部 节 
点 的 集合 称 为 树 的 索引 部 分 〈index part) ， 而 叶子 节点 称 为 顺序 部 分 〈sequence part) ， 央 为 它们 总 是 
按照 顺序 存储 的 。 

Backbone (主干 网 络 〈 或 高 速 链 路 ) ) ， 一 种 传输 数字 网 络 通 信 的 大 容量 通信 (主干 线 ) 线路 。 

Backward Compatible (向 下 兼容 )， 一 个 程序 向 下 兼容 是 指 这 个 程序 能 够 运行 同一 软件 的 老 版 本 所 
创建 的 文件 和 数据 。 一 台 计 算 机 向 下 兼容 是 指 这 个 计算 机 能 够 运行 同一 种 体系 结构 的 老 版 本 计算 机 上 
所 开发 的 软件 。 

Bandwidth (带宽 ): 模拟 通信 介质 能 够 传输 的 频率 范围 ， 用 单位 赫兹 (Hz) 表示。 在 数字 通信 中 ， 
带宽 是 一 个 介质 信息 传输 能 力 的 和 通称， 表示 为 b/s (位 / 秒 )。 

Base Address( 基 地址): 数据 结构 的 第 一 个 元 素 的 地 址 。 这 种 结构 中 所 有 其 他 元 素 的 地 址 都 是 通 
过 距离 基地 址 的 偏 移 量 来 确定 。 

Base/Offset Addressing (基地 址 / 偏 移 量 寻 址 ): 一 种 寻 址 模式 ， 偏 移 量 先 被 加 到 某 个 指定 的 基 址 寄 
存 器 中 ， 然 后 再 加 上 某 个 指定 的 操作 数 来 生成 数据 的 有 效 地 址 。 

Based Addressing (基地 址 寻 址 ) : 一 种 寻 址 模式 ， 使 用 一 个 基 址 寄存 器 (或 显 式 地 指定 或 者 隐 式 地 
指定 ) 来 存放 一 个 偏 移 量 〈 或 者 位 移 ) ， 将 偏 移 量 加 上 操作 数 就 产生 数据 的 有 效 地 址 。 

Basic Input/Output System (基本 输入 /输出 系统 ): 参见 BIOS。 

Batch Processing ( 批 处 理 ) : 一 种 计算 模式 ， 在 正常 的 情况 下 ， 除 了 启动 一 个 批 处 理 任 务 之 外 ， 整 
个 计算 过 程 中 不 需要 人 为 于 预 。 在 批 处 理 模式 下 ， 多 个 相似 的 任务 可 以 组 合 在 一 起 按 顺 序 执行 。 

Baud (〈 波 特 ) :在 某 个 传输 介质 或 传输 方式 中 测量 信号 转变 数目 的 一 种 测量 单位 。 
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BCD，Binary Coded Decimal (二 进 制 编码 的 十 进 制 数 ): 一 种 使 用 4 位 二 进 制 数 来 表示 从 0 到 9 的 
十 进 制 数 的 编码 系统 。BCD 编码 是 EBCDIC 编码 的 基础 。 

Benchmark Suite (基准 套件 ): 一 组 用 来 度量 计算 机 系统 性 能 的 内 核 程 序 的 集合 。 通 过 使 用 不 同 的 
内 核 程 序 ， 可 以 准确 地 评估 计算 机 系统 的 处 理 能 力 。 

Benchmarketing (营销 基准 ): .一 种 计算 机 厂商 广泛 采用 的 营销 方法 ， 通常 是 广告 比 竞争 对 手 的 系 
统 占 优势 的 系统 基准 测试 结果 。 

Benchmarking (基准 ): 一 门客 观 评价 计算 机 硬件 系统 或 软件 系统 的 性 能 的 科学 。 基 准 有 助 于 确定 
升级 一 台 计 算 机 或 提高 计算 机 的 某 个 部 件 的 性 能 。 

BER: 参见 Bit Error Rate。 

Biased Exponent ( 偏 置 指数 ) ， 一 种 对 浮 点 数 的 指数 部 分 进行 的 调整 ， 可 以 消除 指数 中 对 符号 位 的 
需求 。 偏 置 值 表示 0， 是 指数 可 能 取 值 范围 中 靠近 中 间 的 一 个 数值 。 大 于 偏 置 值 的 指数 是 正 指数 。 

Big Endian (大 端 位 序 ): 一 种 存储 器 的 位 序 安排 ， 采 用 大 端 位 序 是 将 多 字 节 字 的 最 高 字 节 存放 在 
存储 器 中 的 最 低地 址 的 位 置 。 

Binary Coded Decimal (二 进 制 编码 的 十 进 制 ) : 参见 BCD。 

Binary Search (二 分 搜索 );， 一 种 在 分 类 数值 的 列表 内 定位 查找 关键 字 的 方法 ， 逐 次 将 列表 对 半 拆 
分 进行 查找 。 

Binary Tree 《二叉树 ): 一 种 由 树 根 、 内 部 节点 和 叶子 组 成 的 非 循环 的 树 形 数据 结构 。 在 二 又 树 结 
构 中 ， 根 节点 和 每 个 内 部 节点 最 多 可 以 有 两 个 指针 引 向 其 他 的 节点 〈 即 最 多 有 两 个 分 支 ) 。 而 叶子 节点 
没有 分 支 节点 。 

Binding Time ( 绑 定时 间 ): 在 符号 地 址 绑 定 发 生 时 所 引用 的 操作 。 装 载 时 间 绑 定 将 地 考 作为 二 进 制 
模块 一 起 装 和 人 到 存储 器 中 。 而 运行 绑 定 则 要 延 时 到 这 个 进程 实际 运行 时 才 进 行 地 绑 定 。 

BIOS，Basic Input/Output System (基本 输入 /输出 系统 )， 可 编程 的 集成 电路 ， 其 中 包含 某 些 特殊 
的 系统 部 件 的 信息 和 程序 。 微 型 计算 机 操作 系统 是 通过 系统 的 BIOS 来 实现 1/0 操作 和 其 他 专用 设备 
的 行为 。 

Bit (位 )， 二 进 制 数 的 缩写 ， 二 进 制 数 的 值 只 能 取 0 或 1。 

Bit Cell (位 单元 ) : 指 在 字 节 的 存储 或 传输 过 程 中 ， 一 个 位 所 占据 的 线性 空间 大 小 或 时 间 的 数量 。 

Bit Error Rate，BER( 误 码 率 )， 收 到 的 出 错 的 位 数 和 收 到 的 总 位 数 的 比率 。 

Black Box ( 黑 盒子 ) : (1) 实现 某 个 功能 的 一 个 模块 ， 模 块 怎样 实现 功能 的 内 部 细节 对 于 模块 外 部 
任何 一 个 人 或 任何 一 个 操作 都 是 不 透明 的 。(2) 在 数据 通信 中 ， 为 适应 系统 协议 而 接 人 的 某 个 功能 设 
备 ， 但 在 最 初 ， 并 不 这 个 设备 做 具体 设计 。 

Block Fieid ( 块 域 ) : 地 址 中 用 来 指定 对 应 的 缓冲 区 空间 块 的 部 分 。 

Blocking interconnection Network (阻塞 型 互连网 络 ) ， -一 种 网 络 类 型 ， 阻 塞 型 互连网 不 允许 在 有 其 
他 同时 发 生 连 接 存在 的 情况 下 ， 建 立新 的 连接 。 

Boolean Algebra (布尔 代数 ) : 一 种 代数 学 ， 操 作 的 对 象 只 包含 两 个 值 ， 通 常 是 真 或 假 两 个 值 。 布 
尔 代 数 也 称 为 符号 逻辑 。 

Boolean Expressions (布尔 表达 式 ): 一 个 由 布尔 变量 和 布尔 操作 符 组 成 的 表达 式 。 

Boolean Function (布尔 函数 ) : 一 个 函数 有 一 个 或 多 个 布尔 输入 值 产生 一 个 布尔 结果 。 

Boolean Identities (布尔 恒等式 ); 一 些 有 关 布 尔 表达 式 和 布尔 变量 的 定律 。 

Boolean Product (布尔 积 ) : 一 个 与 (AND) 操作 的 结果 。 

Boolean Sum (布尔 和 ) :一 个 或 〈OR) 操作 的 结果 。 

Boot，Bootstrapping (引导 程序 〈( 导 人 )): 利用 一 个 小 程序 来 启动 计算 机 全 部 操作 的 过 程 。 

Bootstrap Loader (引导 程序 装载 器 ) : 执行 引导 程序 的 计算 机 固件 。 

Bootstrapping (引导 程序 ) : 参见 Boot。 
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Branch Prediction (分 支 预测 ): 在 指令 执行 之 前 先 猜测 指令 流 中 的 下 一 条 指令 的 过 程 ， 以 避免 由 于 
分 支 转移 导致 流水 线 的 阻塞 现象 。 如 果 预 测 正确 ， 则 流水 线 不 会 产生 延迟 。 如 果 预 测 错误 ， 就 要 冲洗 
流水 线 ， 将 丢弃 由 该 错误 计算 产生 的 所 有 计算 结果 。 

Bridge〈 网 桥 ); 一 种 2 层 的 网 络 元 件 ， 连 接 两 个 类 型 相似 的 网 络 ， 使 它们 看 起 来 像 一 个 网 络 。 网 
桥 是 一 种 “存储 和 转发 ”的 设备 ， 先 接收 和 存储 一 个 整个 的 传输 巾 ， 然 后 转发 出 去 。 

British Standards Institution，BSI (英国 标准 协会 ): 一 个 代表 英国 利益 的 制定 计算 机 行业 标准 的 一 
个 国际 性 组 织 。 

Broadband Cable (宽带 电缆 ) : 一 种 容量 至 少 为 2Mb/s 的 导向 式 网 络 媒体 。 宽 带 通信 采用 多 路 技 
术 的 形式 提供 多 信道 的 数据 。 

Burst Error ( 突 发 错误 〈 区 块 错误 )) : 一 种 多 个 相 邻 的 位 被 损坏 的 错误 模式 。 

Bursty Data ( 突 发 数据 ): 一 种 W/O 操作 ， 主 要 以 大 块 的 、 成 复 的 方式 发 送 数据 ， 上 后 不 是 以 恒定 的 

Bus (总 线 )， 计算 机 各 组 件 之 间 传 送 数据 的 一 组 共享 线路 。 同 步 总 线 采用 时 钟 同步 ， 只 有 当 定 时 
脉冲 到 达 时 ， 才 会 发 生 事件 。 异 步 总 线 使 用 控制 线 来 协调 各 种 操作 ， 并 要 求 有 复杂 的 握手 协议 米 执 行 
强制 定时 。 请 参见 Address Bus、Data Bus 和 Control Bus。 

Bus Arbitration (总 线 仲裁 ): 决定 由 哪 一 个 设备 来 控制 总 线 的 过 程 。 

Bus Cycle (总 线 周 期 )， 两 个 相 邻 总 线 时 钟 脉冲 之 间 的 时 间 间 隔 。 

Bus Protocol (总 线 协 议 ) : 使 用 总 线 的 一 组 规则 。 

Bus-Based Network (基于 总 线 的 网 络 )， 一 种 允许 处 理 器 和 存储 器 通过 一 个 共享 总 线 进行 通信 和 的 网 


Byte ( 字 节 ): 一 组 连续 的 8 位 二 进 制 数 。 

Byte-addressable 〈 按 字 节 编 址 ) : 指 每 个 单独 的 字 节 都 有 一 个 唯一 的 地 址 ， 或 者 说 最 小 可 编 址 的 位 
串 为 一 个 字 节 。 

Cache Coherence Problem (高 速 缓存 的 一 致 性 问题 ): 当 存 储 在 高 速 缓存 中 的 值 与 存储 在 存储 器 的 
值 不 同时 所 产生 的 问题 。 

Cache Mapping 《高 速 缓存 映射 ): 覆盖 寄存 器 地 址 到 高 速 缓存 位 置 的 过 程 。 

Cache (高 速 缓存 ， 简 称 缓存 ) ;一 种 专用 的 高 速 存 储 器 ， 用 来 存放 频繁 的 访问 数据 或 者 最 近 访 问 
的 数据 。 它 有 两 种 类 型 ， 存储 器 高 速 绥 存 和 磁盘 高 速 缓存 。 存 储 器 高 速 缓存 比 主 存储 器 容量 小 但 速度 
快 。 存 储 器 高 速 绥 存 有 两 种 类 型 ， 一 级 高 速 缓存 (LL1) 和 二 级 高 速 缓存 (L2)。Li 是 一 种 又 小 又 快 的 
存储 器 高 速 绥 存 ， 构 建 在 微 处 理 器 的 芯片 内 部 ， 有 助 于 加 速 访问 频繁 使 用 的 数据 。1.2 是 一 组 高 速 的 内 
置式 的 存储 器 芯片 ， 位 于 微 处 理 器 和 主 存储 器 之 间 。 磁 盘 高 速 缓存 是 一 种 用 来 从 磁盘 上 存 读 的 数据 的 
专用 缓冲 器 。 

Campus Network (校园 网 ) ， 在 小 范围 内 跨越 多 个 建筑 物 的 私有 数据 通信 和 网络 。 校 园 网 通常 是 局 域 
网 (LAN) 的 延伸 ， 并 使 用 LAN 的 协议 。 

Canonical Form (标准 形式 〈 范 式 )): 相对 于 布尔 表达 式 来 说 ， 指 两 个 标准 的 形式 : 积 之 和 形式 或 
和 之 积 形式 。 

CD Recording Mode (CD 记录 模式 ) :指定 在 CD-ROM 上 存储 数据 所 使 用 的 格式 。 模 式 0 和 2 用 于 
音乐 记录 ， 但 没有 纠 错 能 力 。 模 式 1 用 于 数据 记录 ， 有 具有 两 级 查 错 和 纠 错 能 力 。 一 个 CD 利用 模式 1 
进行 记录 时 的 总 容量 为 650MB。 而 采用 模式 0 和 模式 2 进行 记录 的 总 容量 为 724MB， 但 是 模式 0 和 模 
式 2 都 不 能 可 靠 地 用 来 记录 数据 。、 

CD-ROM (只 读 光 盘 ) : 一 类 存储 数据 容量 超过 1/2GB 的 光盘 。 其 他 类 型 的 光盘 包括 : CD-R (可 记 
录 光 盘 )、CD-RW (可 重 写 光 盘 ) 和 WORM (只 能 写 一 次 可 以 多 次 读 取 的 光盘 ) 。 

CEN，Comite Europeen de Normaiisation (欧洲 标准 化 委员 会 ) : 计算 机 行业 标准 化 的 欧洲 委员 会 。 
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Central Processing Unit，CPU 中央 处 理 器 ); 负责 取 指 令 、 译 码 指令 、 执 行 指令 和 对 正确 的 数据 
完成 指定 的 操作 序列 的 计算 机 部 件 。CPU 是 由 ALU、 寄 存 器 和 控制 单元 组 成 的 。 

Channel I/O (通道 控制 的 IO) : 使 用 智能 型 的 DMA 接口 来 选择 IO 设备 ， 也 称 为 /O 通道 。 利 
用 一 些小 CPU 来 控制 IO 通道 称 为 MO 微 处 理 器 (IOP)，IO 微 处 理 器 是 专门 为 /O 通道 优化 设 
计 的 。 

Checkpoint 检查 点 ); 在 数据 库 更 新 或 网 络 文件 传输 过 程 中 ， 检 查 点 每 次 发 布 一 个 数据 块 ， 没 有 
出 错 的 数据 块 会 被 提交 到 持久 性 的 存储 介质 。 如 果 处 理 过 程 中 发 生 了 一 个 错误 ， 那 么 直到 最 后 一 个 检 
查 点 的 数据 都 被 认为 是 有 效 的 。 

Checksum ( 校 验 和 ) : 对 一 个 或 多 个 数据 字 节 进行 某 种 算术 运算 后 得 到 的 一 组 二 进 制 位 。 通 常 ， 校 
验 和 位 会 被 添加 到 一 个 信息 字 节 块 的 后 面 ， 以 保持 在 数据 存储 和 传输 过 程 中 的 信息 完整 性 。 比 较 流 行 
的 校 验 和 是 循环 元 余 校 验 (CRC) 方法 。 

Chip 《芯片 ); 由 实现 各 种 门 电 路 所 需要 的 电子 元 件 〈 晶 体 管 、 电 阻 和 电容 ) 组 成 的 微型 硅 半 导体 
晶体 。 

CISC，Complex instruction Set Computer (复杂 指令 集 计算 机 )， 一 种 计算 机 设计 思想 ，CISC 计算 
机 包含 大 量 的 、 长 度 可 变 的 、 复 杂 结 构 的 指令 。 

Client-Server System (客户 服务 器 系统 ): 参见 N-Tiered Architecture。 

Ciock Cycle Time (时钟 周期 ) ， 时 钟 频率 的 倒数 ， 也 称 为 时 钟 周期 (clock period) 。 

Clock Skew (时 钟 漂移 ) : 在 一 个 系统 或 网 络 中 原来 协调 好 的 时 钟 逐 渐 失 去 同步 的 情况 。 

Clock Speed (时 钟 速度 ) : 处 理 器 的 速度 ， 通 常用 兆赫 效 (每 秒 百 万 个 脉冲 ，MHz) 或 于 兆赫 兹 
(每 秒 十 亿 个 脉冲 ，GHz) 来 测量 。 有 时 也 称 为 时 钟 频率 (clock frequency) 或 时 钟 速率 〈clock rate) 。 

C-LOOK: 参见 LOOK。 

Cluster of Workstation，COW (工作 站 集群 )， 类 似 于 NOW 分 布 式 工作 站 的 一 个 集合 ， 但 它 需 对 单 
一 的 实体 负责 管理 。 

Coaxial Cable ( 同 轴 电 缆 )， 一 种 连接 导线 ， 由 包围 钢 质 或 钢 质 芯 线 的 绝缘 层 ， 再 加 上 网 状 编织 的 
接地 屏蔽 层 和 保护 外 套 所 组 成 。 | 

Code Word (编码 字 ): 一 种 包含 m 位 数据 ，r 位 校 验 位 的 n 位 二 进 制 单元 ， 通 常用 于 错误 检测 和 
错误 校正 。 

COLD，Computer Output Laser Disk (计算机 输出 激光 盘 ) : COLD 是 计算 机 的 一 种 输出 方法 ， 用 来 
代替 纸张 和 微型 胶片 。COLD 能 够 提供 数据 的 长 期 存档 储存 。 

Combinational Circuit (组 合 电路 ): 一 种 逻辑 电路 部 件 ， 组 合 电路 的 输出 完全 取决 于 电路 的 输入 

Common Pathway Bus (公共 通道 总 线 )， 由 许多 设备 共享 的 总 线 〈 也 称 为 多 点 总 线 ) 。 

Compact Disk-Read Only Memory (只 读 光 盘 ) ， 参见 CD-ROM。 

Compilation (编译 ) : 使 用 一 个 编译 器 的 过 程 。 

Compiler (编译 器 ): 负责 将 整 块 的 源 代码 一 次 就 翻译 成 目标 代码 的 一 种 程序 。 

Complement ( 补 码 ) : 对 布尔 表达 式 或 布尔 变量 进行 取 反 操作 的 结果 。 

Completely Connected Network (完全 连接 网 络 ): 一 种 所 有 的 部 件 都 被 连接 到 其 他 部 件 的 网 络 。 

Compression Factor Ratio (压缩 系数 〈 比 )): 测量 数据 压缩 操作 的 有 效 性 。 从 数学 上 讲 ， 压 缩 系数 
二 1 一 [已 压缩 的 文件 大 小 二 未 压缩 的 文件 大 小 ] X100%。 这 里 ,文件 大 小 的 测量 用 字 节 来 表示 。 

Computer Architecture (计算 机 体系 结构 )， 主 要 关注 计算 机 系统 的 结构 和 行为 ， 主 要 指 程序 员 所 见 
的 系统 实现 的 逻辑 方面 。 计 算 机 体系 结构 的 内 容 包括 指令 集 和 指令 格式 、 操 作 码 、 数 据 类 型 、 寄 存 器 
的 数目 和 种 类 、 寻 址 方式 、 访 问 主 存储 器 的 方法 和 各 种 不 同 的 W/O 机制。 

Computer Level Hierarchy (计算 机 层次 结构 ): 一 种 抽象 的 计算 机 分 层 结构 。 大 多 数 的 现代 计算 机 
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的 结构 层次 分 为 ， 从 下 到 上 依次 为 : 数字 逻辑 层 、 控 制 层 、 机 器 层 、 系 统 软件 层 、 汇 编 语 言 层 、 高 级 
语言 层 和 用 户 层 。 

Computer Organization (计算 机 组 成 ): 主要 强调 如 控制 信号 和 存储 器 类 型 ， 以 及 包括 计算 机 系统 
的 所 有 物理 方面 。 

Computer Output Laser Disk 〈 计 算 机 输出 激光 盘 ): 参见 COLD。 

Context Switch〈 关 联 转 换 ) :操作 系统 从 一 个 执行 进程 到 另 一 个 执行 进程 的 转换 过 程 。 

Control Bus (控制 总 线 )， 用 于 传输 控制 信号 的 一 部 分 总 线 。 

Control Unit (控制 单元 ): CPU 中 用 来 控制 指令 执行 、 数 据 移动 和 定时 的 部 分 。 控 制 单元 既 可 以 是 
硬 连 线 (由 产生 控制 信和 号 的 物理 门 电 路 组 成 ) 也 可 以 是 微 程序 〈 利 用 微 代 码 解释 指令 和 把 这 些 指 令 转 
换 成 各 种 正确 的 控制 信号 ) 。 

CPU Bound (CPU 约束 ): 一 种 系统 的 性 能 条 件 。 在 CPU 约 东 条件 下 ， 一 个 或 一 组 程序 进程 的 大 
部 分 时 间 都 在 执行 CPU 的 操作 或 者 等 待 CPU 的 资源 。 

CPU Scheduling (CPU 调度 ) : 选择 某 个 正在 等 待 的 进程 去 执行 的 一 个 进程 。 调 度 的 方法 包括 先 来 
先 服务 〈 依 次 选取 队列 中 的 进程 )， 循 环 复 用 〈 给 每 个 进程 都 分 配 部 分 CPU 的 时 间 )， 最 短 作 业 优 先 
(选取 一 个 执行 时 间 最 短 的 任务 ) 和 优先 级 调度 〈 取 决 于 一 些 预 先 确定 的 因素 ， 比 如 一 个 指示 进程 重要 
性 的 编号 ) 。 

CRC: 参见 Cyclic Redundancy Check。 

C-SCAN: 参见 SCAN。 

Cycle Stealing (周期 窃取 ) : 参见 DMA。 

Cyclic Redundancy Check，CRC (循环 元 余 校 验 ): 一 种 主要 用 于 数据 通信 的 校 验 和 。 利 用 校 验 和 
确定 在 一 个 大 的 数据 块 或 信息 字 节 流 中 是 否 会 有 错误 发 生 。 

Daisy Chaining (菊花 链 ) : 一 个 W/O 设备 的 连接 方法 。 葡 花 链 是 指 以 串 行 的 方式 将 一 个 设备 的 输入 
和 另 一 个 设备 的 输出 连接 起 来 。 

DARPAnet，Defense Advanced Research Project Network (国防 部 高 级 研究 计划 网 络 )， 一 种 美国 国 
防 部 主持 的 研究 网 络 系统 ， 通 常 指 最 初 的 因特网 。 由 于 这 个 国防 研究 计划 机 构 在 不 同 的 时 期 分 别 被 命 
名 为 ARPA (国防 研究 计划 机 构 ) 和 DARPA， 所 以 这 种 最 初 的 网 络 就 被 称 为 ARPAnet 和 DARPA- 
net。 

DASD，Direct Access Storage Device (直接 访问 存储 设备 ): DASD 通常 是 指 连接 到 大 型 计算 机 系 
统 的 一 个 大 的 磁盘 库 。DASD 的 命名 源 于 这 样 的 思想 ， 即 磁盘 上 的 每 个 磁盘 存储 单元 都 有 一 个 唯一 的 
地 址 ， 并 且 系 统 可 以 独立 地 访问 这 个 地 址 周围 的 磁盘 扇 区 。 

DAT:， 参见 Serpentine Recording。 

Data (数据 ) : 代表 某 个 测量 性 质 的 一 个 数字 值 ， 指 一 个 事实 。 

Data Bus (数据 总 线 )， 用 于 传输 实际 数据 的 一 部 分 总 线 。 

Data Dependency (数据 相关 性 ): 指 在 程序 执行 过 程 中 出 现 的 情况 : 当 没 有 完全 执行 一 条 指令 时 ， 
却 把 该 指令 的 结果 当成 一 条 后 续 指 令 的 操作 数 。 这 种 数据 的 相关 性 可 能 会 减 慢 CPU 的 流水 线 作 业 。 

Data structure (数据 结构 ): 对 大 量 相 关 的 信息 进行 组 织 便 于 访问 数据 的 一 种 方式 。 数 据 结 构 通 常 
与 数据 结构 的 实现 方式 无 关 ， 因 为 数据 结构 的 组 织 方式 是 一 种 逻辑 上 的 而 不 必 是 物理 上 的 。 

Data Token (数据 令 牌 ): 表示 数据 流 图 中 流动 的 数据 的 一 种 符号 。 在 数据 流 图 中 ， 各 个 节点 的 激 
活 需 要 接收 到 所 有 必需 的 数据 令 牌 。 

Database Management System，DBMS (数据 库 管 理 系统 ): 能 够 提供 管理 服务 和 保持 一 组 相关 文件 
的 顺序 性 和 一 致 性 的 软件 。 

Dataflow Architecture (数据 流体 系 结构 )， 一 种 数据 控制 的 计算 机 体系 结构 。 对 于 数据 流体 系 结构 
的 机 器 ， 是 由 数据 可 用 性 来 驱动 程序 ， 而 不 是 按照 指令 执行 硕 序 来 控制 程序 (就 像 在 指令 控制 的 体系 
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结构 中 一 样 )。 

Datagram (数据 报 ) : 一 种 网 络 协议 数据 单元 (PDU)， 可 以 作为 一 个 单独 分 立 的 单元 进行 路 由 。 
数据 报 通常 是 两 个 通信 实体 之 间 的 一 个 对 话 或 一 个 会 话 的 组 成 部 分 。 因 此 ， 数 据 报 还 包含 保持 传输 的 
数据 包 次 序 的 顺序 信息 和 防止 数据 包 丢 失 的 信息 。 

Datapath (数据 通路 ) : 一 种 由 寄存 器 、ALU 和 连接 (总线) 的 网 络 。 指 示 在 系统 中 数据 必须 遍历 
的 路 径 。 

DBMS: 参见 Database Management System。 

Decoder 〈 译 码 器 ) : 一 种 使 用 输入 值 来 选择 一 根 特定 输出 线路 的 组 合 电路 。 

Dedicated Cluster Parallel Computer，DCPC (专用 集群 并 行 计算 机 ): 一 组 计算 机 工作 站 的 集合 ， 
专门 从 事 某 个 特定 的 并 行 计算 任务 。 

Demodulation( 解 调 )， 从 一 个 被 调制 的 模拟 信号 中 提取 二 进 制 代码 的 过 程 。 参 见 Modulation。 

Dhrystone (基准 程序 ) :一 个 基准 程序 ， 主 要 关注 字符 串 操作 和 整数 操作 。1984 年 由 Siemens Nix- 
dorf 信息 系统 公司 的 Reinhold P. Weicker 开发 的 。 据 报道 ， 命 名 为 Dhrystone 是 一 种 和 Whetstone 基 
准 有 关 的 双关 语 ， 因 为 “Dhrystone 基准 不 处 理 浮 点 ”。 

Difference Engine (差分 机 ) ， 1822 年 ，Charles Babbage 设计 的 一 种 计算 机 器 ， 可 以 自动 求解 多 项 
式 函 数 。 

Digital Signal 0 (数字 信号 0) : 参见 DS-0。 

Digital Subscriber Line (数字 用 户 线路 ): 参见 DSL。 

Digital Versatile Disks (数字 通用 光盘 ): 参见 DVD。 

Dijkstra's Algorithm (Dijkstra 算法 )， 在 网 络 图 中 寻找 一 条 最 低 成 本 费用 的 路 径 的 一 种 算法 。 算 法 
的 基本 思想 是 在 所 有 节点 之 间 的 最 短 连接 链 路 组 成 的 图 中 找到 一 个 最 低 费 用 的 路 径 。 

Diminished Radix Complement (基数 减 1 的 补 码 )， 给 定 一 个 数 N， 基 数 为 -， 占 4 位 ， 则 N 的 计数 
减 1 的 补 码 定义 为 (r4 一 1) 一 N。 对 十 进 制 数 来 说 ，r 二 10， 并 且 基 数 减 1 就 是 10 一 1 一 9。 

Direct Access Storage Device (直接 访问 存储 设备 ): 参见 DASD。 

Direct Addressing (直接 寻 址 ): 一 种 计算 机 的 寻 址 模式 。 直 接 寻 址 是 指 在 指令 中 直接 指定 要 引用 的 
值 的 存储 器 地 址 。 

Direct Mapped Cache (直接 映射 高 速 缓存 ) : 一 种 高 速 缓存 映射 方案 ， 采 用 模块 的 方法 将 存储 器 的 
数据 块 映射 到 对 应 的 高 速 缓存 空 间 块 。 

Direct Memory Access (直接 存储 器 存 取 ): 参见 DMA。 

Disk Scheduling〈 磁 盘 调度 ) : 一 种 磁盘 管理 策略 ， 决 定 访问 磁盘 鹿 区 的 请 求 的 服务 顺序 。 常用 的 
磁盘 调度 策略 有 : FCFS〈( 先 来 先 服 务 )、 最 短 寻 道 时 间 优 先 (SSTF)、SCAN、C-SCAN、LOOK 和 
C-LOOK 。 

Disk Striping (磁盘 分 带 ) ， 在 RAID 驱动 器 中 使 用 的 一 种 映射 方法 ， 在 RAID 驱动 器 中 把 -- 些 连续 
的 数据 块 〈 条 带 ) 以 循环 的 方式 映射 到 不 同 的 磁盘 驱动 器 上 。 

Disk Utilization〈 磁 盘 利用 率 ) : 磁盘 忙于 服务 1/O 请 求 所 占 的 时 间 百 分 比 。 磁 盘 利用 率 是 由 磁盘 的 
速率 和 请 求 到 达 服 务 队 列 的 速率 所 决定 的 。 从 数学 上 表述 为 , 利用 率 = 请 求 到 达 的 速率 二 磁盘 服务 的 
速率 。 这 里 ， 请 求 到 达 的 速率 是 每 秒 钟 服务 请 求 的 数目 ， 磁 盘 服 务 速率 就 是 每 秒 钟 IO 操作 的 次 数 。 

Distributed Computing (分 布 式 计算 ); 指 一 组 网 络 连 接 的 计算 机 协同 工作 去 解决 某 一 个 问题 的 
情形 。 

Divide Underflow (除法 下 滋 ) : 等 效 为 计算 机 被 0 除 的 操作 。 在 这 里 ， 存 放 在 累加 器 中 的 除数 值 
太 小 。 

DLL: 参见 Dynamic Link Library。 

DLT; 参见 Serpentine Recording。 
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DMA，Direct Memory access (直接 存储 器 存 取 )， 一 种 1/0O 控制 方式 。DMA 是 利用 专门 的 电路 
(而 不 是 CPU) 来 控制 /O 活动 。 但 是 ， 由 于 DMA 和 CPU 共享 存储 器 总 线 ， 所 以 DMA 要 消耗 原来 
由 CPU 使 用 的 存储 器 周期 ， 这 也 称 为 周期 窃取 。 

Dot Pitch (点 距 ): 在 显示 器 上 两 个 最 近邻 的 相同 颜色 点 〈 或 像素 ) 之 间 的 距离 。 点 距 越 小 ， 图 像 
越 清晰 。 

DRAM，Dynamic RAM (动态 随机 存储 器 ): 要 求 对 保存 的 数据 进行 周期 性 青 充电 的 RAM。 动 态 
RAM 与 静态 RAM 不 同 ， 静 态 RAM 只 要 有 电源 存在 ， 就 可 以 一 直 保 持 所 存储 的 内 容 。 

DS-0 (数字 信号 0) : 指 一 种 信号 速率 为 64Kb/s PCM (通用 载波 电话 的 脉 码 调制 ) 位 串 。 参 见 Ple- 
siochronous Digital Hierarchy 。 

DSL，Digital Subscriber Line (数字 用 户 线路 ): 通过 公用 交换 电话 网 络 为 居民 区 和 小 型 办 公 提 供 数 
字 服 务 。 两 种 不 兼容 的 DSL 技术 类 型 是 无 载波 振幅 相位 〈CAP) 技术 和 离散 多 音频 服务 (DMT) 技 
术 。 其 中 ，CAP 是 一 种 比较 老 的 且 较 简单 的 技术 ， 而 DMT 是 ANSI 的 DSL 标准 。 

DS-x (数字 信和 号 x): T- 载 波 系 统 所 使 用 的 信号 系统 。DS-0 是 一 种 通过 单 向 电话 会 话 调制 产生 的 
64Kb/s 信和 号。 由 T-1 载波 传输 DS-1 信号 ， 而 由 T-3 载波 传输 DS-3 信号 。 

Dual Stack〈 双 堆栈 ) : 使 用 两 种 不 同 协议 的 通信 设备 。 目 前 ， 大 多 数 双 堆栈 设备 〈 路 由 器 ) 都 支 
持 IPv4 和 IPv6 协议 堆栈 。 

Duality Principle (对 侦 原 理 )， 对偶 原理 证 明了 布尔 等 式 中 的 积 形式 与 和 形式 有 相似 的 关系 。 

Durable Storage (持久 性 存储 介质 ) :一 种 存储 介质 ， 无 需 持续 提供 电流 而 可 以 长 久保 存 数据 。 例 
如 磁盘 、 磁 带 和 光盘 都 是 持久 性 存储 介质 。 

DVD，Digital Versatile Disk〈 数 字 通用 光盘 ): 通常 也 称 为 数字 视频 (video〉 光盘 ， 是 一 种 高 密度 
光盘 存储 介质 。120 毫米 直径 的 单 屋 和 双 层 的 DVD 分 别 能 够 容纳 4.7GB 和 8. 54GB 的 数据 容量 。 

Dynamic Interconnection Network (动态 互连网 络 ) : 允许 两 个 实体 〈 可 能 是 两 个 处 理 器 也 可 能 是 一 
个 处 理 器 和 一 个 存储 器 ) 之 间 的 路 径 从 一 种 通信 方式 到 另 一 种 通信 方式 的 变化 。 

Dynamic Link Library，DLL (动态 链接 库 )， 对 于 一 个 可 执行 的 程序 模块 ， 动 态 连 接 库 是 一 组 链接 
(程序 ) 装载 器 使 用 的 二 进 制 对 象 的 集合 。 

E Carrier System (下 载波 系统 )， 与 北美 工 载波 系统 相对 应 的 欧洲 三 载波 系统 。E-1l 传输 速率 是 
2. 048Mb/s，E-3 传输 速率 是 34. 368Mb/s。 

EBCDIC，Extended Binary Coded Decimal Interchange Code (扩展 的 二 -十 进 制 交换 代码 )， 是 由 
IBM 公司 发 明 的 一 种 8 位 代码 ， 它 同时 支持 大 小 写字 母 ， 以 及 一 定数 目的 其 他 字符 (包括 用 户 自 定义 
的 代码 )， 这 些 其 他 字符 超过 了 当时 的 6 位 和 7 位 代码 的 表现 能 力 。 

EEPROM，Electronically Erasable PROM ( 电 可 擦 除 可 编程 只 读 存 储 器 ): 一 种 可 以 使 用 电场 进行 编 
程 和 擦 除 的 PROM。 

Effective Access Time，EAT (有 效 存 取 时 间 ): 在 存储 器 体系 结构 中 表示 平均 访问 时 间 的 加 权 平 
均值 。 . 

Effective Address 《有 效 地 址 ): 操作 数 在 存储 器 中 的 实际 位 置 。 

EIDE，Enhanced Integrated Drive Electronics (增强 型 集成 驱动 电子 接口 ): 一 个 有 较 高 成 本 效率 比 
的 硬件 接口 ， 这 是 IDE 接口 标准 的 一 种 较 新 的 版 本 ， 用 于 计算 机 及 其 大 容量 存储 器 设备 之 间 的 连接 。 

Elevator Algorithm (电梯 算法 );， 参见 SCAN。 

Embedded System (所 人 式 系 统 ) : 一 种 将 计算 机 集成 到 设备 中 的 系统 。 

Encoding〈 编 码 ) : 一 种 将 普通 文本 转换 成 适合 于 数字 数据 的 存储 或 传输 形式 的 过 程 。 

Encryption (加 密 ): 采用 某 种 算法 和 密 钥 打 乱 一 个 消息 的 过 程 ， 这 样 要 读 取 该 消息 必须 有 相应 的 
密 钥 。 

Entropy( 炉 ): 根据 信息 理论 ， 炳 是 对 消息 的 信息 内 容 的 一 种 度量 。 
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EPROM，Erasable PROM (可 擦 除 的 PROM)， 一 种 可 以 进行 编程 和 擦 除 ( 使 用 专用 设备 ) 以 及 再 
编程 的 PROM 。 

Error Correcting Code ( 纠 错 码 ) : 一 种 代码 结构 ， 可 以 检测 错误 的 存在 和 自动 校正 部 分 或 所 有 的 

Error Detecting Code( 检 和 错 码 ):， 一 种 代码 结构 ， 能 够 检测 到 错误 的 存在 。 

Ethernet (以 太 网 ): 在 1976 年 发 明 的 一 种 主要 的 局 域 网 络 技术 。 支 持 的 数据 传输 速率 达到 
100Mb/s， 超 过 同 轴 电 缆 。IEEE 802. 3 标准 是 构建 在 以 太 网 基础 上 的 ， 但 是 它 与 以 太 网 并 不 完全 
相同 。 

Expanding Opcodes (扩展 操作 码 ): 一 种 指令 设计 ， 人 允许 操作 码 根据 指令 所 要 求 的 操作 数 的 数目 来 
改变 指令 的 长 度 。 

Expansion Bus (扩展 总 线 ): 一 种 外 部 总 线 ， 用 来 连接 外 围 设备 、 内 部 元 件 、 扩 展 槽 和 1/O 端口 到 
计算 机 其 他 部 分 。 

Extended Binary Coded Decimal interchange Code (扩充 的 二 -十 进 制 冬 换 代码 ): 参见 EBCDIC。 

External Fragmentation (外 部 碎片 )， 指 存储 器 中 的 许多 小 孔 〈 碎 片 )， 可 以 自由 地 使 用 这 些 碎片 ， 
但 是 由 于 碎片 太 小 而 不 能 保存 有 意义 的 信息 。 参 见 Fragmentation 。 

Fast ATA (快速 AT 附属 设备 ) ， 参 见 EIDE。 

FC-AL: 参见 Fibre Channel 。 

FDM: 参见 Frequency Division Multiplexing 。 

Fetch-Decode-Execute Cycle 〈 取 指 - 译 码 -执行 周期 ) :计算 机 执行 程序 的 指令 周期 。 

Fiber Optic Cable (光纤 ) : 参见 Opticat Cable。 

Fiber Channel (光纤 信道 ) :一 种 串 行 数据 传输 技术 ， 传 输 数 据 的 速率 可 达到 1Gbit/s。 光 纤 信 道 促 
裁 环 (FC-AL) 是 三 种 光纤 信道 拓扑 结构 中 使 用 最 广泛 的 ， 而 且 价 钱 最 便宜 。 

Firewali (防火 堵 ) : 一 种 第 3 层 的 网 络 层 设备 〈 配 上 相应 的 程序 组 )， 利 用 基于 设备 内 的 编程 策略 
来 限制 对 某 个 网 络 的 访问 。 防 火 墙 可 以 保护 网 络 或 某 种 网 络 服务 不 被 未 经 授权 的 用 户 访问 。 

FireWire ( 串 行 总 线 ): 一 种 自行 配置 的 串 行 1/O 连接 技术 ， 现 在 是 IEEE 1394 标准 。 火 线 支持 传 
统 的 数据 传输 ， 以 及 同步 的 输入 和 输出 ， 其 数据 传输 速率 可 达 40Mbit/s。 

First In，First Out (FIFO) Replacement Algorithm (先进 先 出 的 中 换算 法 )， 一 种 置换 算法 ,算法 的 
思想 是 在 存储 器 中 驻 留 时 间 最 长 的 项 将 被 替换 。 

Flash Memory (闪存 ): 一 种 EEPROM， 人 允许 成 块 地 编写 数据 或 擦 除数 据 。 

Flip-Flop 《触发 器 )， 时序 电 路 的 最 基本 部 件 ， 可 以 用 作 存 储 单元 ， 即 使 输入 取消 后 也 能 保持 一 个 
稳定 的 输出 。 同 时 ， 触 发 器 也 是 一 种 最 简单 的 时 序 电路 。 和 触发 器 和 锁 存 器 不 同 ， 触 发 器 是 边沿 触发 ， 
而 锁 存 器 是 电 平 触发 。 

Floating-Point Emulation( 浮 点 仿真 )， 一 种 针对 浮 点 数 操作 的 程序 指令 的 仿真 。 

Floating-Point Operations Per Second (每 秒 钟 浮 点 操作 数 )， 参 见 FLOPS。 

Floating-Point Unit ( 浮 点 单元 ) : 为 了 优化 二 进 制 小 数 计算 的 性 能 而 采用 的 专用 计算 机 电路 。 

Floppy Disk (软盘 ) : 一 种 可 移动 的 、 低 密度 的 磁性 存储 介质 ， 是 在 一 个 有 弹性 的 聚 酯 薄膜 衬 底 上 
涂 上 一 层 磁 性 薄膜 而 组 成 的 。 

FLOPS (每 秒 钟 浮 点 操作 数 ) : FLOPS 是 评价 计算 机 性 能 的 一 种 过 时 方法 ， 并 没有 明确 的 定义 。 某 
些 基准 程序 (例如 Whetstone 和 Linpack) 对 于 测试 的 系统 可 以 产生 每 秒 钟 上 百 万 个 浮 点 操作 数 
(MFLOPS), 

Flux Reversal ( 磁 通 量 反 转 ) : 用 在 计算 机 磁带 或 磁盘 存储 器 设备 上 的 磁性 涂 层 材料 的 磁极 性 变化 。 
取决 于 编码 方法 的 不 同 ， 通 量 反 转 可 以 表示 二 进 制 数 0 或 者 1 。 

Flynn's Taxonomy (Flynn 分 类 法 )， 一 种 基于 并 行 处 理 的 数据 流 数目 和 指令 流 数目 的 计算 机 体系 结 
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构 的 分 类 方案 。 参 见 SISD、SIMD、MISD 和 MIMD。 

FM: 参见 Frequency Modulation。 

Forest (森林 ) : 一 个 或 多 个 不 相连 的 nn 叉 树 或 二 叉 树 的 集合 。 

FPU: 参见 Floating-Point Unit。 

Fragmentation (碎片 〈 分 段 )) : (1) 当 存 储 器 或 磁盘 空间 变 得 不 可 用 时 就 会 产生 碎片 。 参 见 Internal 
Fragmentation 和 External Fragmentation。(2) 分 段 是 为 了 满足 特定 的 网 络 需 求 将 IP 数据 报 分 成 一 个 个 
小 部 分 的 过 程 。 

Frequency Division Multiplexing，FDM ( 频 分 多 路 复 用 ): 一 种 利用 介质 来 传输 几 个 通信 流 的 方法 。 
当 FDM 用 在 长 途 电话 电缆 时 ， 会 给 每 一 个 呼叫 分 配 一 个 它 自己 的 频带 ， 允 许 十 多 个 通话 方便 地 在 同 
一 个 导体 上 传输 ， 而 不 会 产生 相互 之 间 的 于 扰 。 

Frequency Modulation，FM (频率 调制 ) : 在 数字 技术 应 用 时 ，FM 是 一 种 信息 存储 或 传输 中 使 用 的 
编码 方法 。 在 频率 调制 过 程 中 ， 每 个 位 单元 最 少 需 要 有 一 次 信号 转变 。 这 些 同步 的 信号 转变 发 生 在 位 
单元 边界 的 开始 处 。 

Full Duplex (全 双 工 通信 ): 一 种 传输 模式 。 在 全 双 工 模式 下 ， 一 个 通信 介质 或 一 根 数据 总 线 可 以 
同时 进行 双向 的 数据 传输 。 

Full-Adder (全 加 器 ) : 一 种 执行 3 位 二 进 制 数 加 法 的 电路 ， 其 中 一 位 是 一 个 进位 。 全 加 器 产生 两 个 
输出 ， 一 个 是 输出 和 ， 另 一 个 是 进位 。 

Ful-Stroke seek (完全 〈 全 程 ) 寻 道 ) ,磁盘 驱动 臂 从 最 里 层 的 磁道 移动 到 最 外 层 磁 道 的 过 程 ， 反 

之 亦 然 。 

Fully Associative Cache (全 关联 高 速 缓存 ) : 一 种 高 速 缓存 映射 方案 ， 人 允许 主 存储 器 中 的 数据 块 可 
以 映射 到 高 速 缓存 上 的 任何 一 个 空间 块 的 位 置 。 对 于 高 速 缓存 要 求 关联 存储 器 。 

G: 前 级 ,表示 230 ， 大 约 为 十 亿 。 

Galois Fieid 〈 伽 罗 瓦 域 ) ， 一 个 有 限 元 素 的 代数 域 。 常 用 的 全 罗 瓦 域 是 通过 使 用 一 个 素数 进行 取 模 
操作 来 定义 : GF (p) = {0，1,，…p 一 1}， 对 于 所 有 的 整数 Z mod p。 

Gate ( 门 电路 ): 一 种 计算 二 值 信号 的 各 种 函数 的 小 型 电子 部 件 。 

Gateway (网 关 ) : 从 外 部 网 络 进 入 某 个 网 络 的 一 个 人 口 点 。 

General Purpose Register Architecture (通用 寄存 器 体系 结构 )， 一 种 使 用 一 组 通用 寄存 器 来 保存 指 
令 操作 数 的 计算 机 体系 结构 。 

General Purpose Register (user-visible register) (通用 寄存 器 (用 户 可 见 寄存 器 )): 能 够 被 程序 员 
访问 和 用 于 各 种 目的 的 寄存 器 。 

Geometric Mean (几何 平均 值 )， 在 计算 机 性 能 分 析 中 ， 经 常 使 用 的 集中 趋势 的 一 种 度量 标准 。 几 
何平 均值 CG 是 = 个 测量 值 的 积 的 = 次 方 根 : G= (ziXxzsXxzsX…Xxzn)ln。 几 何平 均值 给 出 一 个 一 臻 
性 的 数字 ， 可 以 利用 几何 平均 值 来 进行 性 能 比较 ， 而 不 必 考 虑 数据 的 分 布 情况 。 

Graphics Interchange Format，GIF 〈 图 像 交 换 格 式 ) : 参见 LZW Compression。 

Guided Transmission Media (导向 性 传输 介质 ) ， 指 如 铜 线 或 光缆 这 样 的 物理 连接 器 ， 它 们 与 网 络 部 
件 直接 进行 物理 连接 。 

Haif Duplex ( 半 双 工 通信 ): 一 种 传输 模式 。 在 半 双 工 模式 下 ， 通 信介 质 或 一 根 数据 总 线 一 次 只 能 
进行 一 个 方向 的 数据 传输 。 

Half-adder ( 半 加 器 ): 一 种 执行 2 位 二 进 制 数 加 法 的 电路 。 半 加 器 产生 两 个 输出 ， 一 个 是 输出 和 ， 
另 一 个 是 进位 。 | 

Hamming Code ( 海 明 编码 )， 一 种 错误 纠正 代码 ， 代 码 中 增加 有 一 个 带 有 校 验 位 (或 元 余 位 的 信 
息 字 节 。 

Hamming Distance ( 海 明 距 离 )， 编 码 字 不 同 的 二 进 制 位 的 位 距 。 在 一 个 编码 的 所 有 字 对 中 的 最 小 
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海 明 距离 就 是 编码 的 最 小 海 明 距 离 。 最 小 海 明 距 离 决 定 了 编码 的 错误 检测 和 错误 校正 的 能 力 。 

Handshake (握手 协议 ) : 在 发 送 方 和 接收 方 之 间 传 输 数 据 之 前 所 要 求 的 协议 。 发 送 方 通过 握手 协 
议和 接收 方 进行 联络 ， 并 启动 字 节 的 传输 。 随 后 ， 接 收 方 必须 应 答 发 送 方 的 这 个 请 求 ， 并 且 指 出 接收 
数据 已 经 就 绪 。 

Harmonic Mean 〈 调 和平 均值 ) : 在 计算 机 性 能 分 析 中 ， 用 于 速率 或 比率 测量 时 经 常 使 用 的 一 种 集 
中 趋势 的 一 种 度量 标准 。 调 和 平均 值 由 公式 给 出 : 再 一 ?二 〈]1/zl 十 1/zs 十 1/zs 十 … 十 1/zn)。 

Hazard (冒险 ) : 造成 流水 线 阻塞 的 一 种 因素 。 包 括 以 下 方面 : 数据 相关 性 、 资 源 冲突 和 存储 器 提 
取 访 问 延 迟 。 

Head Crash (磁头 挤 损 )， 由 于 读 写 头 碰 到 磁盘 的 表面 而 引起 刚性 磁盘 的 破坏 性 损坏 。 

Heap〔 堆 集 ):， 主 存储 器 空间 。 在 进程 执行 期 间 ， 由 于 数据 结构 的 创建 和 清除 ， 会 引起 对 主 存储 器 
堆 集 的 分 配 和 取消 分 配 。 

Helical Scan Recording (螺旋 线 扫 描记 录 )， 一 种 把 数据 位 存放 置 到 磁盘 介质 上 的 方法 ， 让 磁带 通 
过 一 个 有 两 个 读 写 头 的 倾斜 旋转 鼓 轮 〈 或 称 为 绞盘 ) 。 

Hertz( 赫 效 ): 测量 时 钟 频率 的 度量 单位 。 一 赫兹 就 是 每 秒 一 个 周期 。 

Hextet: 每 四 位 一 组 ， 用 来 表示 一 个 单个 的 十 六 进 制 数 。 

High Performance Peripherai Interface (高 性 能 外 围 设备 接口 ): 参见 HiPPI。 

High-order Interleaving (高 位 交叉 存储 ): 交叉 存储 器 使 用 地 址 的 高 位 来 选择 存储 器 模块 。 

HiPPI，High Performance Peripheral interface (高 性 能 外 围 设备 接口 ); 一 个 高 容量 的 存储 接口 和 局 
域 网 中 的 高 速 链 路 协议 。 

Hit《〈 命 中 ) : 当 在 一 个 指定 的 存储 器 层次 发 现 有 所 请 求 的 数据 ， 或 者 是 在 存储 器 中 发 现 有 所 请 求 的 
页 面 时 ， 就 发 生 了 一 个 命中 。 

Hit Rate (命中 率 ) : 在 给 定 的 存储 器 层次 找到 所 要 求 的 数据 的 存储 器 访问 的 百分比 。 

Hit Time (命中 时 间 )， 在 给 定 的 存储 器 层次 访问 请 求 的 信息 所 需要 的 时 间 。 

Hollerith Card (穿孔 卡片 )， 由 Herman Hollerith 发 明 的 用 于 计算 机 输入 输出 的 穿孔 卡片 ， 这 个 穿 
孔 卡 片 通常 含有 80 列 。 

Hot Plugging ( 热 播 拔 ) ， 当 计算 机 正在 运行 时 ， 添 加 或 删除 设备 的 能 力 。 

Hub (集线器 ): 一 种 OSI 参考 模型 第 1 层 的 设备 ， 有 多 个 输入 输出 端口 。 负 责 把 从 一 个 或 多 个 位 
置 收 到 的 数据 包 向 一 个 或 多 个 网 络 设备 进行 广播 传送 。 

Huffman Coding〈 赫 夫 曼 编码 )， 一 种 统计 的 数据 压缩 方法 。 赫 夫 曼 编码 从 输入 符号 中 创建 二 叉 树 。 
输出 结果 是 从 输入 符号 出 现 的 频率 和 一 个 译 码 二 进 制 串 的 字典 中 得 到 的 一 个 二 进 制 编码 。 

Hypercube Networks 〈 超 立方 体 网 络 ): 网 状 网 络 的 多 维 延伸 ， 在 每 一 维 都 有 两 个 处 理 器 。 

ICANN:， 参见 Internet Corporation for Assigned Names and Numbers。 

IETF， 参见 Internet Engineering Task Force 。 

Immediate Addressing (立即 寻 址 ): 一 种 寻 址 模式 ， 指 令 要 引用 的 值 就 跟 在 指令 中 操作 码 的 后 面 。 

Indexed Addressing ( 变 址 寻 址 )， 一 种 寻 址 模式 ， 变 址 寻 址 方式 使 用 一 个 变 址 寄存 器 ( 既 可 以 明显 
式 地 指定 也 可 以 隐 式 地 指定 ) 来 存放 一 个 偏 移 量 (或 位 移 )， 最 后 需要 把 偏 移 量 加 上 操作 数 来 产生 数据 
的 有 效 地 址 。 

Indirect Addressing (间接 寻 址 ): 一 种 寻 址 模式 ， 间 接 寻 址 使 用 地 址 域 的 几 个 数位 来 指定 一 个 存储 
器 地 址 ， 这 个 存储 器 的 地 址 用 作 指 向 实际 操作 数 的 一 个 指针 。 

Indirect Indexed Addressing (间接 变 址 寻 址 ): 一 种 寻 址 模式 ， 间 接 变 址 寻 址 同时 采用 了 间接 寻 址 和 
变 址 寻 址 两 种 寻 址 模式 。 

Inductance (电感 ): 在 导体 内 抵抗 电流 变化 的 一 个 物理 量 。 同 时 ， 当 有 电流 通过 导体 时 ， 导 体 附 
近 就 会 产生 磁场 。 
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Industry Standard Architecture Bus，ISA (工业 标准 结构 总 线 )，20 世纪 80 年 代 PC/XT 总 线 的 
IEEE 标准 。 

Infix Notation (中 缀 表示 法 ):; 操作 符 和 操作 数 的 一 种 安排 硕 序 ， 中 缀 表示 法 是 操作 符 放 在 操作 数 中 
间 ， 例 如 2 十 3。 

Information Theory (信息 理论 )， 主要 研究 信息 本 身 、 信 息 存 储 和 编码 方法 的 一 种 理论 。 

Information 信息): 对 人 们 有 意义 的 数据 。 

Input-Output Devices (输入 输出 设备 ): 一 种 允许 用 户 和 计算 机 进行 通信 ， 或 者 提供 对 数据 进行 读 
写 访问 的 设备 。 

Input-Output System 〈 输 人 输出 系统 ): 一 个 负责 在 外 部 设备 和 主机 之 间 移 动 编码 数据 的 子 系统 部 
件 ， 一 般 由 CPU 和 主 存储 器 组 成 。 

Institute of Electrical and Electronic Engineers，IEEE (电子 与 电气 工程 师 协 会 )， 一 个 致力 于 电子 和 
计算 机 工程 行业 发 展 的 组 织 。 

Instruction Cycle (指令 周期 ) : 参见 Fetch-Decode-Execute Cycle。 

Instruction Set Architecture，ISA 指令 集 系统 体系 结构 )， 在 机 器 上 运行 的 所 有 软件 和 执行 软件 的 
硬件 之 间 的 协议 接口 界面 。 指 令 系 统 规定 了 计算 机 可 以 执行 的 指令 和 每 个 指令 的 格式 。 

Instruction-based MO (基于 指令 的 MO) : 一 种 /0O 方 法。 这 里 ，CPU 有 完成 输入 和 输出 功能 的 专 
用 指令 。 | 

Integrated Circuitt，IC (集成 电路 ) : 在 第 三 代 计 算 机 中 使 用 的 半导体 技术 。 集 成 电路 允许 在 单个 站 
片上 集成 多 个 晶体 管 。 芯 片 被 封装 在 一 个 带 有 外 部 引 脚 的 陶瓷 或 塑料 包装 中 。 

Integrated Service Digital Network (综合 业务 数字 网 ) : 参见 ISDN。 

Interconnection Network (互连网 ) :一 种 连接 多 个 处 理 器 和 存储 器 的 网 络 。 

Interface 接口): 一 种 将 计算 机 系统 连接 到 一 个 外 部 实体 的 设备 。 硬 件 接口 包括 软件 、 控 制 单元 ， 
以 及 连接 MO 设备 和 计算 机 的 物理 连接 器 。 同 时 ， 还 包括 人 与 机 器 交互 的 方式 。 两 种 常用 的 系统 接口 
界面 是 命令 行 接口 界面 和 图 形 用 户 接口 界面 (GUD) 。 

interleaving (交叉 存储 技术 ) : 一 种 对 磁盘 驱动 器 中 的 扇 区 进行 编 址 的 方法 。 在 这 里 ， 磁 盘 扇 区 在 
磁道 边界 周围 并 不 是 按 连续 的 次 序 分 布 的 。 这 是 一 种 比较 老 的 技术 ， 主 要 是 用 来 补偿 磁盘 驱动 器 的 旋 
转速 度 和 从 磁盘 中 读 取 数据 的 速率 之 间 的 差别 。 参 见 Memory Interleaving、Low-order Interleaving 和 
High-order Interleaving 。 

Intermediate Node (中间 节点 )， 网 络 路 由 器 的 另 一 个 名 字 。 

Internal Fragmentation〈 内 部 碎片 ) :一 个 给 定 的 存储 空间 块 的 内 部 碎片 。 除 了 已 经 获得 块 授权 的 进 
程 外 ， 其 他 的 任何 进程 都 不 能 使 用 这 种 内 部 碎片 。 

International Organization for Standardization，ISO (国际 标准 化 组 织 ): 一 个 协调 全 球 范围 内 标准 开 
发 活动 的 组 织 。 

International Telecommunication Union，ITU (国际 电信 联盟 ); 一 个 主要 关注 通信 系统 协同 工作 能 力 
的 组 织 。 

internet Corporation for Assigned Names and Numbers，ICANN (因特网 域名 管理 中 心 )， 一 个 非 敌 利 
性 的 国际 组 织 ， 主 要 负责 协调 网 络 地 址 ， 网 际 协议 中 使 用 的 参数 值 和 高 层 域名 例如 .org 和 .edu 等 的 
分 配 工作 。 

Internet Engineering Task Force，IETF (因特网 工程 任务 组 ): 一 个 由 行业 专家 组 成 的 松散 联盟 ， 主 
要 负责 为 网 际 协议 制定 详细 规范 。IETF 是 在 因特网 架构 委员 会 (IAB) 管理 下 运作 的 一 个 组 织 ， 而 
IAB 又 是 在 一 个 非 僵 利 的 网 际 协 会 (ISOC) 的 监督 下 运作 的 。IETF 所 有 的 提议 标准 都 是 以 草案 
(RFC) 的 形式 来 发 布 的 。 | 

Internet Protocol (网 际 协议 )， 参见 IP。 
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Internet Service Provider，ISP (网 络 服务 提供 商 ): 一 些 提供 一 个 或 多 个 网 络 服务 接 入 点 (POP) 
的 私有 企业 。ISP 通过 提供 访问 网 络 来 赚钱 ， 还 常常 提供 一 些 增值 服务 ， 比 如 网 站 。 

Internetwork (因特网 网 络 )， 由 一 些 使 用 不 同 协议 的 子 网 组 成 的 网 络 。 

Interpreter (解释 程序 ) ;一 种 通过 分 析 将 源 代码 转换 成 目标 代码 的 程序 ， 解 释 程 序 每 次 执行 一 行 源 
代码 。 

Interrupt (中 断 ): 在 系统 中 ， 改 变 〈 或 中 断 ) 正常 的 取 指 - 译 码 -执行 周期 的 一 个 事件 。 

interrupt Cycle (中 断 周期 ): 指令 周期 的 一 部 分 ， 在 中 断 周 期 ，CPU 会 去 检查 是 否 有 一 个 中 断 请 求 
在 等 待 中 。 如 果 有 ， 就 调用 一 个 中 断 处 理 程序 。 

Interrupt Handling (中 断 处 理 ) : 执行 某 个 特定 的 程序 去 处 理 一 个 中 断 程序 的 过 程 。 

Interrupt-driven MO (中 断 控制 的 IO): 一 种 VO 方法 。 这 种 VO 处 理 方式 最 具 高效 性 ， 内 为 只 有 
当 输入 设备 有 数据 准备 处 理 时 ， 才 向 CPU 发 信号 ， 而 其 他 时 间 则 允许 CPU 去 处 理 其 他 工作 。 

IO bound (1/O 约束 ): 一 种 系统 的 性 能 条 件 。 在 I/O 约 东 条 件 下 ， 一 个 或 一 组 程序 进程 的 大 部 分 
时 间 都 在 执行 /0 操作 或 者 是 等 待 /O 的 资源 。 

IP，internet Protocol《〈 网 际 协议 ) : 一 种 无 连接 的 网 络 层 通信 协议 ，IP 以 数据 包 的 形式 传输 信息 ， 
这 种 数据 包 称 为 数据 报 (datagram)。 每 个 数据 报 中 包括 地 址 信息 和 数据 信息 。 

iR，instruction Register (指令 寄存 器 ) : 在 一 个 程序 中 存放 下 -条 将 要 执行 的 指令 。 

ISA Bus (ISA 总 线 ); 参见 Industry Standard Architecture (ISA) Bus。 

ISDN，integrated Service Digital Network (综合 业务 数字 网 ) ， 一 种 过 时 的 通信 技术 ， 它 试图 提供 一 
个 统一 的 公用 电话 网 来 传输 数据 、 音 频 和 视频 信号 。 在 许多 商业 安装 上 ISDN 都 被 ATM 所 取代 。 

ISO Open System Interconnect Reference Model (开放 系统 互 连 参 考 模型 ) ， 参 见 ISO/OSI RM。 

ISO/OSI RM: 一 种 由 7 层 结构 组 成 的 数据 通信 协议 模型 。 这 7 层 结构 分 别 是 : 应 用 层 、 表 示 层 、 
会 话 层 、 传 输 层 、 网 络 户 、 数 据 链 路 层 和 物理 层 。ISO 的 工作 之 所 以 称 为 一 个 参考 模型 ， 是 因为 它 的 
复杂 性 。 实 际 上 ， 没 有 一 种 商业 系统 使 用 模型 中 所 严格 规定 的 所 有 特性 。 

ISOC: 参见 Internet Engineering Task Force。 

lsochronous Data (同步 数据 )， 在 某 种 程度 上 是 时 间 敏感 的 数据 。 如 果 数 据 传输 时 间 太 迟 ， 数 据 的 
许多 内 容 信息， 会 丢失 。 实 时 数据 是 同步 数据 的 一 个 例子 ， 例 如 要 求实 时 传送 的 语音 和 视频 数据 
传输 。 

Joint Photographic Experts Group (联合 图 像 专 家 组 )， 参见 JPEG。 

JPEG; 一 种 带 有 损耗 的 数据 压缩 方法 ， 是 由 联合 图 像 专家 组 资助 设计 的 。JPEG 是 一 种 8 步骤 的 
压缩 方法 ， 人 允许 用 户 指 定 在 压缩 图 像 中 可 以 接受 视觉 效果 的 降级 。JPEG2000 是 JPEG 版 本 中 比较 低 且 
较 复杂 的 一 种 软件 工具 。 

K; 一 种 前 级 ， 它 的 值 为 2 或 1024 (大 约 为 1000)。 例 如 ，2KB 就 是 2048 位 。 

Kernel (内 核 ):， (1) 指 当 将 1/O 常规 程序 和 其 他 非 CPU 集约 的 代码 从 一 个 应 用 程序 中 剥离 后 所 保 
留 下 来 的 一 个 功能 有 限 的 程序 。 在 创建 基准 程序 套件 中 常常 使 用 内 核 程序 。 (2) 指 一 种 规模 最 小 的 ， 
但 是 提供 关键 功能 的 程序 模块 。 在 操作 系统 的 环境 中 ， 内 核 程 序 是 系统 操作 时 需要 持续 执行 的 操作 系 
统 部 分 。 

LAN，Local Area Network (局 域 网 ) : 在 同一 建筑 物 内 所 构建 的 计算 机 网 络 。 目 前 ， 大 多 数 LAN 
使 用 以 太 网 技术 ， 速 率 可 达到 100Mb/s。 

Latch〈 锁 存 器 ) : 一 种 电 平 触发 的 触发 器 。 

Least Recent Used (LRU) Replacement Algorithm (最 近 最 少 使 用 的 置换 算法 ): 一 种 替换 算法 ， 置 
换 最 近 最 少 使 用 的 项 目 。 

Linear Array Network (Ring Network)〈 线 性 阵列 〈 或 环形 ) 网 络 ) :人 允许 任何 一 个 实体 可 以 和 它 的 
两 个 邻居 实体 直接 进行 通信 ， 但 是 任何 一 种 其 他 通信 都 必须 要 经 过 多 个 实体 后 才能 到 达 目 的 地 。 
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Tree Network( 树 形 网 络 )， 一 种 在 非 循 环 树 状 结构 中 排列 实体 的 网 络 。 

Link Editor (链接 编辑 器 ) : 参见 Linking。 

Linked List (链表 (链接 列表 ))， 一 种 数据 结构 ， 其 中 每 个 元 素 都 包含 一 个 指针 ， 这 个 指针 既 可 以 
是 空 指针 ， 也 可 以 指向 同 种 类 型 的 另外 一 个 数据 元 素 。 

Linking 链接)， 一 个 程序 的 外 部 符号 和 来 自 其 他 文件 的 所 有 输出 符号 的 一 种 匹配 过 程 ， 链 接 结果 
产生 一 个 单一 的 没有 不 可 决定 的 外 部 符号 的 二 进 制 文件 。 

Linpack (线性 代数 程序 包 ) ， 一 种 用 来 度量 浮 点 性 能 的 软件 。 这 种 线性 代数 包 是 一 组 称 为 基本 线性 
代数 子 程序 (BLAS) 的 子 程序 的 集合 ， 使 用 双 精 度 算 术 来 求解 线性 方程 的 系统 。 

Little Endian〈 小 端 位 序 ) ， 一 种 存储 器 的 位 序 安 排 ， 采 用 小 端 位 序 是 将 多 字 节 字 的 最 低 字 节 存 放 在 
存储 器 中 的 最 低地 址 的 位 置 。 

Load-Store Architecture (装载 存储 体系 结构 ) ， 一 种 计算 机 体系 结构 。 这 种 结构 的 指令 系统 中 只 有 
装 人 和 存储 这 两 条 指令 可 以 访问 存储 器 。 所 有 其 他 指令 都 必须 使 用 寄存 器 访问 数据 。 

Local Area Network (局域网 ); 参见 LAN。 

Local Bus (局 域 总 线 ): 在 PC 机 中 ， 外 围 设备 直接 连接 到 CPU 中 的 一 种 数据 总 线 。 

Local Loop (本 地 回路 ):; 通常 指 连接 中 央 电 话 交换 局 、 住 宅 区 和 小 型 企业 所 在 地 的 低 带 宽 的 铜 双 
绞 线 。 本 地 回路 有 时 也 称 为 “最 后 一 里 ”， 尽管 客户 所 在 地 和 中 央 电 话 交 换 局 之 间 的 连接 经 常 超过 
一 里 。 

Locality，Locality of Reference (引用 的 局 部 性 ) : 计算 机 程序 的 一 种 特性 ， 程 序 倾向 于 以 集中 成 团 
成 能 的 形式 访问 数据 或 指令 。 

Logical Partition 〈 逻 辑 分 区 ) :一 种 计算 机 系统 的 非 物 理性 分 区 ， 逻 辑 分 区 会 产生 一 种 在 物理 上 有 
分 立 的 实体 分 割 的 幻觉 。 

LOOK (C-LOOK) ;一 种 磁盘 调度 算法 。 在 这 种 算法 中 ， 只 有 当 所 请 求 的 最 外 层 磁道 和 最 内 层 磁道 
都 完成 数据 的 读 取 或 写 人 后， 磁盘 臂 才 会 改变 运动 方向 。LOOK 还 有 一 种 变化 形式 ， 称 为 C-LOOK 
( 即 循环 LOOK) ， 在 这 里 磁盘 上 最 高 编号 的 磁道 和 0 磁道 被 认为 是 相 邻 的 磁道 。 

Loop Fission (循环 分 裂 ) : 大 循环 分 裂 成 小 循环 的 过 程 。 在 循环 体 优 化 时 ， 循 环 分裂 有 重要 作用 ， 
可 以 消除 数据 相关 性 和 减少 由 于 冲突 引起 的 高 速 缓存 延迟 。 参 见 Loop Peeling。 

Loop Fusion (循环 并 合 ): 组 合 多 个 使 用 相同 数据 项 的 循环 的 过 程 。 循 环 并 合 可 以 增强 高 速 缓存 的 
性 能 ， 增 加 指令 级 的 并 行 执行 和 减少 循环 开销 。 

Loop Interchange (循环 交换 ) : 一 种 重新 排列 循环 的 过 程 ， 可 以 按照 更 加 接近 于 数据 存储 的 方式 访 
问 存储 器 。 

Loop Peeling (循环 剥离 ) ， 一 种 类 型 的 循环 分 裂 。 指 从 循环 体 中 移 去 开始 语句 或 结尾 诸 句 的 过 程 。 

Loop Unrolling (循环 展开 ) : 一 种 循环 展开 的 过 程 。 循 环 展 开 后 每 次 新 的 选 代 都 包括 几 个 原来 的 选 
代 过 程 ， 这 样 每 个 循环 选 代 都 可 以 完成 更 多 的 计算 。 

Loopback Test ( 回 送 测试 ) ， 用 来 检查 通信 设备 的 功能 和 运行 在 主机 系统 上 的 协议 。 在 回 送 测试 期 
间 没 有 数据 进入 网 络 。 

Loosely-coupled Multiprocessors (松散 耦合 的 多 处 理 器 ): 具有 物理 上 的 分 布 式 存储 器 的 多 处 理 机 
系统 。 也 称 为 分 布 式 系统 。 

Low-order interleaving (低位 交叉 存储 ) : 交叉 存储 器 使 用 地 址 的 低位 来 选择 存储 器 模块 。 

LPAR: 参见 Logical Partition 。 

Large Scale Integration，LSI (大 规模 集成 电路 ): 每 个 芯片 上 包含 1000 到 10000 个 元 件 的 集成 
电路 。 

LZ77 Compression (LZ77 压缩 ) ， 一 种 使 用 文本 窗口 的 数据 压缩 方法 。 这 种 压缩 方法 中 ， 文 本 窗口 
用 作为 一 个 字典 ， 并 与 一 个 包含 被 编码 的 信息 的 前 视 缓冲 器 协同 作业 。 如 果 能 够 在 字典 中 找到 任何 一 
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个 前 视 缓冲 器 里 面 的 字符 ， 那 么 窗口 中 文本 的 长 度 和 位 置 都 被 写 人 到 输出 。 如 果 没 有 找到 文本 ， 则 这 
个 未 编码 的 符号 被 写 人 时 要 增加 一 个 标志 位 ， 用 来 指出 这 个 符号 应 该 被 用 作 一 个 文字 。 

LZ78 Compression (LZ78 压缩 ) : 一 种 不 同 于 LZ77 的 一 种 数据 压缩 方法 。 它 取消 了 固定 大 小 的 文 
本 窗口 的 限制 。 相 反 ， 它 增加 了 一 个 带 有 输入 令 牌 的 树 形 结构 。 整 个 trie 都 会 跟 在 编码 信息 后 面 被 写 
人 到 磁盘 ， 而 在 译 码 信息 之 前 首先 读 取 这 个 trie。 

LZW Compression (LZW 压缩 ) : 一 种 更 有 效 的 实现 L278 压缩 技术 的 方法 ， 在 这 里 ，trie 的 大 小 受 
到 了 严格 的 控制 。LZW 是 GIF 数据 压缩 方法 的 基础 。 

M: 前 级 ，220 或 1048576 〈 大 约 100 万 ) 。 例 如 ，2MB 就 是 221 字 节 ， 或 者 大 约 200 万 字 节 。 

MAC:， 参见 Medium Access Control。 

MAC Address (MAC 地 址 )， 轩 化 在 网 络 接口 卡 〈NIC) 电路 中 的 一 个 唯一 的 6 字 节 物理 地 址 。 前 
3 个 字 节 是 制造 厂商 的 标识 码 ， 由 IEEE 来 指定 。 最 后 3 个 字 节 是 制造 厂商 分 配给 NIC 的 一 个 唯一 的 标 
识 码 。 在 全 世界 范围 内 ， 没 有 任何 两 个 网 络 接口 有 同样 的 MAC 地 址 。 网 络 协 议 层 映射 这 个 物理 MAC 
地 址 到 最 少 一 个 逻辑 地 址 。 

Main Memory ( 主 存储 器 ) : 用 于 存放 程序 指令 和 数据 的 存储 器 。 通 常 由 RAM 存储 器 来 实现 。 

MAN，Metropolitan Area Network〈 城 域 网 ) ， 城 域 网 是 一 种 高 速 网 络 ， 主 要 用 于 覆盖 城市 和 城市 的 
周边 地 区 。 

Manchester Code (曼彻斯特 编码 ) : 也 称 为 相位 调制 (PM) 编码 ， 是 信息 存储 或 传输 中 使 用 的 一 
种 编码 方法 ， 无 论 是 一 个 0 还 是 一 个 1， 每 位 都 提供 一 个 信号 转变 。 在 PM 中 ， 每 个 二 进 制 的 1 都 由 一 
个 向 上 的 信号 转变 来 表示 ， 而 每 个 二 进 制 的 0 都 由 一 个 向 下 的 信号 转变 来 表示 。 如 果 需 要 ， 会 在 每 个 
位 单元 的 边界 提供 一 个 额外 的 信号 转变 。 

Mantissa (尾数 )， 在 科学 计数 法 中 一 个 数 的 尾数 部 分 。 与 指数 部 分 不 同 的 有 是， 指数 表示 基数 的 指 
数 释 ， 尾 数 乘 以 指数 就 得 到 了 要 求 的 数值 。 

MAR ，Memory Address Register (存储 器 地 址 寄存 器 ) : 一 种 保存 要 引用 的 数据 的 存储 器 地 址 的 寄 
存 器 。 

Maskable Interrupt (可 屏蔽 中 断 ) ， 能够 被 忽略 或 被 中 止 的 一 类 中 断 。 

MBR ，Memory Buffer register (存储 器 缓冲 寄存 器 ): 一 种 既 可 以 保存 刚 从 存储 器 中 读 取 的 数据 又 
可 以 保存 准备 好 写 人 到 存储 器 中 的 数据 的 寄存 器 。 

Mean Time to Failure (平均 失效 时 间 ): 参见 MTTF。 

Medium Access Controt (MAC) (介质 访问 控制 ) : 一 种 连接 节点 到 网 络 的 方法 。 介 质 访问 控制 两 种 
主要 的 方法 是 令 牌 传递 和 载波 监听 /冲突 检测 (CSMA/CD)。 

Medium Access Control Address (介质 访问 控制 地 址 )， 参见 MAC Address。 

Memory Bound (存储 器 约束 ) : 一 种 系统 的 性 能 条 件 。 在 CPU 约束 条 件 下 ， 一 个 或 一 组 程序 进程 
的 大 部 分 时 间 都 在 执行 主 存储 器 的 操作 或 者 是 等 待 存储 器 的 资源 。 

Memory Hierarchy，Hierarchical Memory 存储 器 分 层 结构 )， 不 同 层 次 的 存储 器 的 使 用 方法 。 每 层 
的 存储 器 都 有 不 同 的 访问 速度 和 存储 容量 ， 主 要 是 为 了 取得 更 好 的 性 价 比 ， 而 不 是 只 使 用 一 种 单一 存 
储 器 类 型 。 

Memory lnterleaving (存储 器 交叉 存储 ) : 把 存储 器 分 割 成 多 个 存储 器 模块 〈 或 库 ) 的 一 种 技术 。 参 
见 Low-order Interleaving 和 High-order Interleaving。 

Memory-mapped i/O (存储 器 映射 的 IO):， 指 当 接口 中 的 寄存 器 出 现在 计算 机 的 存储 器 映射 中 时 ， 
访问 存储 器 和 访问 VO 设备 之 间 并 没有 真正 的 区 别 。 

Memory-Memory Architecture (存储 器 -存储 器 体系 结构 ): 一 种 计算 机 的 体系 结构 。 这 种 结构 允许 
一 条 指令 执行 一 个 操作 ， 而 这 种 操作 并 不 要 求 至 少 有 一 个 操作 数位 于 寄存 器 中 。 

Mesh Network (网 状 网 络 ) : 每 个 实体 都 连接 4 个 或 6 个 (取决 于 这 种 网 络 是 二 维 网 络 还 是 三 维 网 
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络 ) 相 邻 实体 的 一 种 网 络 。 

Message latency (消息 延迟 ): 一 个 消息 的 第 一 位 到 达 和 目的 地 所 需要 的 时 间 。 

Metric (度量): 描述 系统 性 能 的 一 个 数字 。 

Metropolitan Area Network: See MAN。 

MFM， 参见 Modified Frequency Modulation 。 

Microcomputer (微型 计算 机 ) : 使 用 一 个 微 处 理 器 的 计算 机 。 

Microkernel ( 微 内 核 ) : 一 个 操作 系统 的 部 件 ， 指 一 个 相对 较 小 的 程序 进程 ， 它 提供 基本 的 操作 系 
统 功能 ， 并 协助 外 部 模块 来 完成 特定 的 任务 。 

Microoperations 〈 微 操作 ) : 一 种 “微型 ”指令 ， 规 定 了 一 些 可 以 对 寄存 器 中 的 数据 所 执行 的 基本 
操作 。 

Microprocessor ( 微 处 理 器 ) ;在 单个 芯片 上 完成 CPU、 存 储 器 和 I/O 功能 的 处 理 器 。 

Microprogram ( 微 程序 ) :一 种 用 来 把 指令 转换 成 机 器 语言 的 软件 。 

Middfeware (中 间 件 ): 一 种 粗 格 的 软件 分 类 法 。 指 位 于 操作 系统 层 之 上 ， 而 在 应 用 程序 层 之 下 运 
行 的 提供 服务 的 程序 软件 。 

Millions of Instructions per second (每 秒 钟 百 万 条 指令 )， 参见 MiPS。 

MIPS，Multiple Instruction，Multiple Data (多 指令 多 数据 )， 一 种 计算 机 体系 结构 ， 采 用 多 个 控制 
点 ， 每 个 控制 点 都 有 其 自己 的 指令 和 数据 流 。 

Minuend (被 减 数 ) : 在 一 个 算术 减法 中 ， 被 减 数 减 去 减 数 得 到 的 结果 。 

MIPS (每 秒 钟 百 万 条 指令 ): 一 种 过 时 的 测量 计算 机 系统 性 能 的 方法 。 从 数学 上，MIPS 二 (执行 
的 指令 数 ) 二 (执行 时 间 X105)。MIPS 过 于 依赖 计算 机 的 体系 结构 而 用 处 不 大 。 这 个 度量 单位 还 引起 
了 首 字母 缩写 的 创造 性 解释 ， 例如,“ 处 理 器 速度 的 误导 指示 器 ”和 “推销 员 业 绩 的 无 意义 的 指示 器 ”。 

MISD，Muitiple Instruction，single Data (多 指令 单数 据 ): 一 种 计算 机 体系 结构 ， 可 以 在 同一 个 数 
据 流 上 操作 多 个 指令 流 。 

Miss Penalty 缺失 损失 ); 处 理 一 个 缺失 所 需 的 时 间 ， 其 中 包括 在 替换 一 个 上 层 存储 器 中 的 数据 块 
的 时 间 ， 青 加 上 传送 请 求 的 数据 到 处 理 器 的 时 间 。 

Miss Rate (缺失 率 )， 在 一 个 给 定 的 存储 器 层级 上 ， 没 有 找到 所 要 求 的 数据 的 存储 器 访问 的 百 
分 比 。 

Miss (缺失 ) ， 当 在 给 定 的 存储 器 层次 上 找 不 到 所 要 求 的 数据 时 ， 就 会 发 生 缺 失 。 

MNG，Multiple-image Network Graphics〈 多 图 像 网 络 图 形 ): MNG 是 PNG 的 -一 种 扩展 ， 它 允许 压 
缩 多 个 图 像 到 一 个 文件 中 。 这 些 文件 可 以 是 任何 类 型 的 文件 ,例如 灰 度 、 真 彩色 或 者 甚至 是 JPEG 。 

Modem，Modulator/Demodulator (调制 解 调 器 ) : 调制 是 将 数字 信和 号 转换 成 模拟 信号 ， 并 可 以 利用 
模拟 线路 (电话 线 〉 进行 传输 ， 而 解 调 是 把 传送 过 来 的 模拟 信号 变换 成 等 效 的 数字 信号。 

Modified Frequency Modulation，MFM (调制 的 频率 调制 ): 数据 存储 或 传输 的 一 种 编码 方法 。 这 种 
方法 只 是 在 连续 0 之 间 的 位 单元 边界 才 提 供 信 号 转变 。 对 于 MFM， 每 -- 对 位 单元 只 需 至 少 提供 一 个 信 
号 转变 ， 这 不 同 于 PM 或 FM 中 每 一 个 位 单元 都 需要 一 个 信号 转变 。 

Modulation (调制 )， 指 按照 信息 信号 改变 载波 特性 的 过 程 。 数 字 信 和 号 可 以 通过 模拟 载波 进行 传输 ， 
这 里 只 需要 改变 模拟 载波 信和 号 的 某 些 特 性 来 表示 一 个 二 进 制 的 代码 。 可 以 把 模拟 信号 振幅 、 频 率 或 者 
是 振幅 和 频率 同时 调制 成 能 够 传输 二 进 制 信号 的 载波 。 参 见 Modem。 

Moore's Law (摩尔 定律 ) : 一 个 预测 定律 : 硅 芯 片 的 集成 度 每 隔 18 个 月 将 增加 一 倍 。 

MPP，Massively Parallel Processor (大 量 信息 并 行 处 理 机 ): 一 种 MIMD 的 分 布 式 存储 器 体系 结 
构 ， 这 种 结构 中 的 多 处 理 器 并 不 共享 存储 器 。 

MSI，Medium Scale Integration (中 规模 集成 电路 ) : 每 个 芯片 上 有 100 到 1000 个 元 件 的 集成 电路 。 

MTTF，Mean Time to Failure (平均 失效 工作 时 间 ): MTTF 是 一 个 元 部 件 寿 命 的 数学 期 望 值 ， 
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MTTF 是 利用 制造 业 中 通常 使 用 的 统计 质量 管理 方法 推演 出 来 的 。 这 只 是 一 个 理论 值 ， 并 不 一 定 反应 
了 元 部 件 的 实际 寿命 。 

Multicast (多 播 )， 一 种 网 络 消息 发 布 方法 ， 发 送 一 个 消息 由 多 个 节点 读 取 。 

Multiple-image Network Graphics 〈 多 图 像 网 络 图 形 )， 参 见 MNG。 

Multiplexer (多 路 复 用 器 );， 一 种 有 多 个 输入 一 个 输出 的 组 合 电路 ， 利 用 控制 线 来 选择 多 个 输入 线 
中 的 某 一 条 线路 ， 并 直接 连接 到 单一 输出 线路 上 。 

Multiplexing (多 路 技术 ) : 在 许多 个 互 不 相关 的 、 独 立 的 连接 中 共享 一 个 通信 介质 。 一 个 数字 载波 
中 ， 通 过 交叉 时 间 段 分 配给 每 个 连接 一 个 信道 。 而 在 宽带 载波 的 情况 下 ， 通 过 宽带 介质 分 配给 每 个 连 
接 一 个 特定 波长 〈 频 率 ) 的 载波 。 

Multipoint Bus (多 点 总 线 ): 由 多 个 设备 共享 的 总 线 ， 也 称 为 公用 通路 总 线 。 

Multiprocessor System (多 处 理 器 系统 ): 包含 多 个 CPU 的 计算 机 系统 。 

Multiprogramming (多 道 程 序 处 理 ) : 在 单个 CPU 中 ， 多 个 程序 的 并 发 执行 。 

Multistage Interconnection Network (Shuffle Network) (多 级 互连网 络 ): 使 用 2X2 开 关 和 多 级 状态 
构造 的 交换 网 络 ， 例 如 Omega 网 络 ， 也 称 为 洗 牌 网 络 。 

Multitasking〈 多 任务 处 理 ): 并 发 地 运行 多 个 进程 。 多 任务 处 理 不 同 于 多 道 程序 处 理 ， 多 道 程 序 处 
理 中 的 多 个 程序 进程 总 是 属于 同一 个 用 户 。 

Multithreading 多 线程 技术 ): 为 了 增加 并 发 性 ， 将 一 个 进程 细 分 为 多 个 不 同 的 控制 线程 的 过 程 。 

NAP ，Network Access Point《〈 网 络 访问 点 ): 为 了 连接 其 他 的 JISP， 由 区 域 网 络 服务 提供 商 使 用 的 
交换 中 心 。 

Narrowband Cable (窄带 电缆 ) : 一 种 为 单 频传 输 优化 设计 的 导向 网 络 媒体 类 型 。 

N-ary Tree (CN 叉 树 )， 由 树 根 、 内 部 节点 和 叶子 组 成 的 一 个 非 循环 的 数据 结构 。 树 根 和 内 部 节点 
最 多 可 以 有 个 指针 指向 其 他 节点 ( 即 最 多 及 个 分 支 )。 而 没有 分 支 节点 的 节点 是 叶子 。 

Network Access Point (网 络 访问 点 ): 参见 NAP。 

Network interface Card，NIC (网 络 接口 卡 ): 一 种 /0 扩展 电路 板 ， 它 常常 包含 OSE 协议 堆栈 中 最 
少 的 三 个 协议 层 。 网 络 接口 卡 会 将 系统 总 线 上 传输 的 并 行 数据 转换 成 串 行 信号 在 通信 介质 上 传播 。 网 
络 接口 卡 还 负责 把 系统 数据 从 二 进 制 数 转换 为 网 络 使 用 的 编码 数据 ， 反 之 亦 然 。 

Network of Workstation (NOW) (工作 站 网 络 ): 一 组 并 行 运 行 的 分 布 式 工作 站 的 集合 ， 而 这 些 网 络 
节点 不 能 用 作 常 规 的 工作 站 。 

Neural Network (神经 网 络 ) : 一 种 计算 机 系统 的 类 型 。 这 种 计算 机 由 大 景 简单 的 处 理 单元 组 成 ， 这 
些 处 理 单元 都 独立 地 处 理 一 个 非常 大 的 问题 的 一 小 部 分 。 这 些 处 理 单元 必须 通过 使 用 一 种 特殊 的 学 习 
算法 经 历 训 练 过 程 。 

NIC: 参见 Network Interface Card。 

Noise (噪声 ) : 一 种 干扰 信和 号 准确 传输 的 电学 现象 ， 噪 声 强度 通常 用 分 贝 (dB) 来 度量 。 

Nonblocking Interconnection Network (无 阻塞 型 互连网 ) : 一 种 网 络 类 型 ， 无 阻塞 型 互连网 络 允 许 在 
有 其 他 同时 发 生 的 连接 存在 的 情况 下 建立 新 的 连接 。 

Nonmaskable Interrupt ( 非 屏 项 中 断 ): 一 种 高 优先 级 的 中 断 ， 不 能 够 被 中 止 ， 而 且 必 须要 得 到 
应 答 。 
Non-Return-to zero (NRZ) (不 归 零 编码 )， 一 种 为 数据 传输 设计 的 编码 方式 ， 在 NRZ 编码 中 ,1 总 
是 表示 高 ，0 总 是 表示 低 ， 或 反之 亦 然 。 典 型 情况 下 ,“ 高 ”为 十 5v 或 十 3v,，“ 低 ”为 一 5v 或 一 3v。 如 
果 发 送 方 和 接收 方 不 能 够 严格 同步 的 话 ， 则 这 种 编码 是 无 效 的。 在 磁性 存储 器 中 ，NRZ 编码 是 由 磁 通 
量 反 转 来 实现 的 。 

Non-Return-to-Zero-invert (NRZI) ( 反 转 不 归 零 编码 ): 一 种 用 于 数据 存储 和 传输 的 编码 方式 ， 这 种 
编码 为 二 进 制 数 1 提供 一 种 信号 转变 ， 而 对 二 进 制 数 0 没有 信号 转变 。 信 号 转变 可 能 是 从 高 到 低 ， 也 
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可 能 是 从 低 到 高 。 这 种 频繁 的 信号 转变 有 助 于 保持 信号 同步 。 

Nonuniform Memory Access，NUMA ( 非 均匀 存储 器 访问 计算 机 ): 一 种 共享 存储 器 的 MIMD 计算 
机 。MIMD 机 上 的 每 个 处 理 器 配 有 自己 的 一 块 存储 器 空间 ， 从 而 会 导致 附近 的 存储 器 访问 要 比 访问 属 
于 其 他 处 理 器 的 存储 器 所 花费 的 时 间 少 。 

Normalization ( 归 一 化 (或 规格 化 )): (1) 在 计算 机 性 能 分 析 中 ， 归 一 化 是 表示 统计 的 性 能 测量 的 
一 种 方法 ， 归 一 化 性 能 是 度量 系统 性 能 和 一 个 标准 系统 性 能 的 比值 ; (2) 在 浮 点 表示 法 中 ， 对 一 个 数 
进行 规格 化 就 是 要 调整 表示 中 的 指数 使 得 小 数 部 分 最 左边 的 位 为 1。 

NOW: 参见 Network of Workstation。 

NRZ: 参见 Non-Return-to-Zero。 

NRZI， 参 见 Non-Return-to-Zero-lnvert。 

N-Tiered Architecture (N 层 体 系 结构 ): 这 是 一 种 执行 环境 ， 其 中 进程 在 一 个 以 上 的 计算 机 系统 上 
执行 。 客 户 服务 器 系统 通常 使 用 一 个 3 层 的 体系 结构 ， 第 一 层 是 桌面 计算 机 ， 第 二 层 是 应 用 程序 服务 
器 ， 第 三 层 是 数据 库 服务 器 。 应 用 程序 服务 器 负责 管理 这 些 应 用 程序 ， 以 及 桌面 计算 机 和 数据 库 服 务 
器 之 间 的 交互 作用 。 

Nybbie or Nibble ( 半 字 节 ): 一 个 字 节 的 一 半 。 字 节 是 由 一 个 高 半 字 节 和 一 个 低 半 字 节 组 成 。 

Nyquist Law (这 硅 斯 特定 律 ) : 奈奈 斯 特定 律 证 明 ， 没 有 信号 能 够 以 比 它 的 频率 快 两 倍 的 速率 来 传 
输 信息 。 用 公式 表示 为 ， 最 大 数据 率 一 2X 带宽 Xlog。( 信 号 电 平 数 ) 波 特 。 

Octet( 八 位 字 节 )，(1) 利用 三 位 一 组 来 表示 一 个 八进制 数字 ; (2) 在 互连网 中 指 的 是 一 组 8 个 相 
邻 的 位 〈 在 其 他 地 方 也 称 为 一 个 字 节 ) 。 

OC-x: 参见 SONET。 

One's Complement Notation ( 反 码 表示 法 ): 又 称 为 1 的 补 码 表示 法 ， 是 一 种 用 来 表示 带 符号 的 二 进 
制 数 值 的 方法 。 正 数 简单 地 用 符号 幅 值 格式 来 表示 ， 对 于 负数 ， 则 将 相应 的 正 数 表示 中 的 所 有 位 翻 位 
( 按 位 取 反 )。 

Opcode (操作 码 ) ， 指 令 中 规定 所 要 执行 操作 的 部 分 。 

Operating System (操作 系统 )， 一 种 控制 计算 机 系统 整体 操作 的 软件 ， 操 作 系 统 包 括 ， 进程 调度 和 
管理 ， 进 程 保护 ， 存 储 器 管理 ，1/O 操作 和 安全 。 

Operation Counting (操作 计数 ) : 一 个 进程 ， 负 责 计算 在 一 个 循环 中 所 执行 的 指令 类 型 的 数目 ， 然 
后 决定 每 种 指令 类 型 所 要 求 的 机 器 周期 的 数目 。 接 着 这 些 信 息 会 越 来 越 实现 更 好 的 指令 平衡 ， 如 果 可 
能 的 话 ， 将 提高 程序 的 性 能 。 

Optical Cable (光缆 ) : 一 种 导向 网 络 媒体 的 类 型 ， 通 常 称 为 光纤 电缆 。 光 缆 是 由 一 束 细小 〈1. 5 到 
125pgm) 的 玻璃 纤维 或 塑料 线 绳 组成， 外面 用 一 个 防护 塑料 套 缠绕 。 光 纤 传 导 光 就 类 似 于 铜 导 线 传输 
电流 和 水 流 过 管道 一 样 。 

Optical Carrier (光纤 载波 ) : 参见 SONET。 

Optical Jukebox 光盘 柜 ): 一 种 自动 光盘 存储 库 ， 可 以 直接 访问 大 量 的 光盘 。 光 盘 柜 能 够 存放 几 
十 个 到 儿 百 个 光盘 ， 总 容量 可 以 达到 50 到 1200GB 或 者 更 多 。 

Overclocking (超频 ) : 一 种 用 来 提高 计算 机 系统 性 能 的 方法 ， 将 一 些 特定 的 系统 部 件 的 性 能 应 用 
到 极限 。 

Overflow (溢出 ) ， 如果 寄存 器 容量 不 足以 去 存放 一 个 算术 运算 的 结果 时 ， 就 会 发 生 溢出 。 在 带 符 
号 的 算术 运算 中 ， 当 进入 符号 位 的 进位 与 移出 符号 位 的 进位 不 相等 时 ， 就 检测 到 一 个 溢出 的 情况 。 

Overlay (覆盖 ) :一 种 存储 器 的 管理 方法 。 在 这 里 ， 程 序 员 需 要 控制 装 人 程序 子 模 块 的 定时 同步 。 
现在 ， 这 个 任务 通常 是 由 系统 的 存储 器 管理 设备 自动 完成 的 。 

Packed Numbers (压缩 码 ) : 在 一 个 字 节 中 ， 利 用 相 邻 4 位 字 节 来 存放 BCD 编码 的 值 ， 并 留 给 符号 
一 个 4 位 字 节 。 
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Page Fault (页 面 错误 〈 缺 页 )) ， 当 一 个 请 求 的 页 不 在 主 存储 器 中 ， 而 必须 从 磁盘 复制 到 存储 器 中 
时 ， 就 发 生 了 缺 页 。 

Page Field (页 域 ): 地 址 中 用 来 指定 请 求 数据 的 所 在 页 (可 能 是 虚拟 页 ， 也 可 能 是 物理 页 ) 的 
部 分 。 

Page Frames (页 帧 ) : 在 实现 虚拟 存储 器 时 ， 主 存储 器 (物理 存储 器 被 分 成 的 相同 大 小 的 空间 
块 ， 称 为 帧 。 

Page Mapping (页 映射 ); 一 种 把 虚拟 地 址 转换 为 物理 地 址 的 机 制 。 

Page Table (页 表 ): 一 个 记录 有 进程 的 虚拟 页 的 物理 位 置 的 记录 表 。 

Pages (页 ): 虚拟 存储 器 (逻辑 地 址 空间 〉 被 分 成 固定 大 小 的 空间 块 ， 每 个 空间 块 的 大 小 和 一 个 
页 帧 相等 。 虚 拟 页 被 存放 到 磁盘 上 ， 直 到 需要 时 才 调 人 存储 器 。 

Paging (分 页 ): (1) 一 种 实现 虚拟 存储 器 的 方法 。 分 页 时 ， 主 存储 器 被 划分 为 固定 大 小 的 空间 块 
〈 帧 )， 而 程序 也 被 划分 为 同样 大 小 的 块 : (2) 把 一 个 虚拟 页 面 从 磁盘 中 复制 到 主 存储 器 中 的 一 个 页 帧 
的 过 程 。 

Parallel Communication (并行 通信 ): 通过 通信 介质 一 次 传输 一 个 整 字 节 (或 整 字 ) 的 通信 。 通 信 
介质 〈 数 据 总 线 或 外 围 设备 接口 电费) 必须 为 每 一 位 都 提供 一 根 传输 导线 。 还 需要 有 其 他 导线 负责 管 
理 数据 的 交换 。 时 钟 信号 〈 选 通 脉冲 ) 对 正确 地 处 理 并 行 数据 传输 是 非常 关键 的 。 参 考 Serial Commu- 
nication 。 

Parity (奇偶 校 验 )， 最 简单 的 错误 检测 方法 ， 它 是 一 个 字 节 中 1 的 和 的 函数 。 根 据 字 节 中 所 有 其 
他 位 的 和 是 奇数 还 是 偶数 ， 奇 偶 校 验 位 来 决定 是 “ 开 ” 还 是 “ 关 ”。 

Parking Heads (停靠 磁头 )， 当 硬盘 系统 关 断 电源 时 ， 读 写 磁头 会 退 到 一 个 安全 的 地 方 ， 以 防止 损 
坏 介 质 。 

PC (Program Counter) 〈 程 序 计数 器 ) : 保持 程序 中 要 执行 的 下 一 条 指令 地 址 的 寄存 器 。 

PCI: 参见 Peripheral Component Interconnect。 

PCM: 参见 Pulse-Code Modulation。 

P-code Language (P 代码 语言 ): 一 种 既 能 够 进行 编译 又 能 够 进行 解释 的 语言 。 

PDH: 参见 Plesiochronous Digital Hierarchy。 

PDU，; 参见 Protocal Data Unit。 

Perceptron (感知 器 ) : 在 神经 网 络 中 的 一 个 可 训练 的 神经 元 。 

Peripheral Component interconnect，PCI (外 围 设 备 互 连 ) :一 种 Intel 公司 发 明 的 局 部 总 线 标准 ， 支 
持 多 种 外 部 设备 的 连接 。 

Phase Modulation (PM) : 参见 Manchester Code。 

Physical Address (物理 地 址 )， 物理 存储 器 的 实际 地 址 。 

Pile of PCs (POPC) (PC 机 群 ): 一 组 不 同类 型 的 专用 硬件 ， 用 来 构建 一 个 并 行 计 算 机 系统 。 
BEOWULEF 就 是 POPC 的 一 个 例子 。 

Pipelining (流水 线 作 业 ): 一 种 计算 机 技术 ， 通过 把 取 指 - 译 码 -执行 周期 分 割 成 一 些 较 小 的 步 又 
《流水线 级 )， 在 流水 线 中 这 些 较 小 的 步骤 可 以 相互 重合 和 并 行 执行 。 

Plesiochronous Digital Hierarchy，PDH ( 准 同步 数字 体系 ) :一 组 载波 速率 的 集合 : 从 T-1 到 T-4， 
通过 连续 使 用 多 路 技术 形成 的 。 这 种 体系 之 所 以 称 为 准 同步 (区 别 于 同步 ) 体系 ， 是 因为 每 个 网 络 元 
件 〈 例 如 交换 机 或 多 路 复 用 器 ) 都 有 自己 的 时 钟 ， 这 些 时 钟 与 其 层次 上 面 的 时 钟 保持 周期 性 的 同步 。 
与 一 个 实际 的 同步 网 络 的 区 别 是 ， 在 载波 上 没有 设置 单独 定时 信号 。 在 北美 PDH 已 经 被 SONET 系统 
所 取代 ， 而 在 世界 的 其 他 地 区 PDH 被 SDH 系统 所 替换 。 

Plug-and-Play 〈( 即 插 即 用 ) ， 计 算 机 自动 配置 设备 的 能 力 。 

PM: 参见 Manchester Code。 
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PNG，Portable Network Graphics (可 移植 网 络 图 形 格式 )， 一 种 数据 压缩 方法 ， 首 先 使 用 赫 夫 曼 编 

码 方法 编码 消息 ， 然 后 再 使 用 L277 压缩 方法 再 次 压缩 消息 。 

Pointer (指针 ): 一 个 存放 在 寄存 器 或 存储 器 中 作为 一 个 数据 值 的 存储 器 地 址 。 

Point-of-Presence (存在 点 ):; 参见 Internet Service Provider。 

Point-to-point Bus (点 对 点 总 线 )， 在 系统 中 连接 两 个 特定 设备 的 一 和 总线。 

Polling( 轮 询 )， 系统 不 断 地 检查 寄存 器 或 通信 端口 ， 测 试 是 否 有 数据 信号 存在 。 

POP， 参见 Internet Service Provider。 

Port ( 端 日 ); (1) 计算 机 系统 中 的 一 种 连接 插 晶 (接口);， 用 来 提供 对 I/O 总 线 或 控制 器 的 访问 ; 
在 TCP/IP 协议 套件 中 ， 端 口 是 标 识 某 个 特定 协议 服务 的 一 个 数字 值 。 

Portable Network Graphics (可 移植 网 络 图 形 格 式 )， 参见 PNG。 

Postfix Notation (后 缀 表示 法 ); 一 种 操作 符 和 操作 数 的 排序 方法 。 后 级 表示 法 是 把 操作 符 放 在 操 
作 数 后 面 。 例 如 23 十。 参见 Reverse Polish Notation。 

POTS，Plain Old Telephone Service (人 简易 老式 电话 业务 )， 简易 老式 电话 业务 提供 模拟 服务 和 少量 
的 增值 服务 。 

Prefetching( 预 取 ) ， 一 种 减少 访问 存储 器 或 磁盘 的 技术 。 使 用 预 取 技术 时 ,会 从 存储 器 中 读 到 包 
括 请 求 页 的 多 个 后 续 页 面 ， 或 者 从 磁盘 中 读 取 包括 请 求 扇 区 的 多 个 连续 筷 区 ， 期 望 而 这 些 后 续 的 页 面 
或 扁 区 中 的 一 个 或 多 个 不 久 就 需要 被 用 到 。 

Prefix Notation (前 缀 表示 法 ); 一 种 操作 符 和 操作 数 的 排序 方法 。 前 缀 表示 法 是 把 操作 符 放 在 操作 
数 的 前 面 ， 例 如 十 23。 

Price-Performance Ratio (价格 性 能 比 ):， 一 种 建立 在 系统 规格 性 能 上 的 某 个 特定 系统 的 “价值 ”的 
度量 方法 。 从 数学 上 ， 价 格 性 能 比 是 系统 价格 除 以 一 种 有 意义 的 系统 性 能 度量 的 比值 。 价 格 性 能 比 要 
充分 考虑 系统 性 能 度量 方法 和 系统 拥有 者 要 承担 的 总 费用 才 有 意义 。 

Principle of Equivalence of Hardware and Software〈 和 硬件 和 软件 等 效 性 原理 ) : 这 种 原理 说 明了 硬件 
可 以 完成 软件 能 够 做 的 任何 事情 ， 而 软件 也 能 够 实现 硬件 所 有 功能 。 

Product-of-Sum Form (和 之 积 的 形式 ): 一 种 布尔 表达 式 的 标准 形式 ， 是 一 组 和 项 的 与 (AND) 操 
作 的 集合 。 

Profiling 〈 细 化 重组 )， 一 种 程序 分 拆 过 程 ， 把 一 个 程序 代码 划分 为 一 些小 的 程序 殿 ， 对 每 个 小 程 
序 块 进行 时 间 分 配 ， 决 定 哪些 块 会 占用 大 部 分 的 程序 时 间 。 

Program Counter Register (PC) (程序 计数 器 寄存 器 )， 一 种 专用 寄存 器 ， 用 来 保存 下 一 条 将 要 执行 
的 指 今 地 址 。 

Programmed I/O (程序 控制 的 WO 方式 ): 在 这 种 LI/O 方式 中 ，CPU 必须 等 待 /O 模块 完成 一 个 请 
求 的 VO 操作 后 才 可 以 执行 其 他 操作 。 

PROM，Programmable ROM (可 编程 的 只 读 存 储 器 ): 一 种 可 以 用 适当 的 设备 对 ROM 进行 编程 的 
只 读 存 储 器 。 

Protection Fault (保护 错误 )， 当 一 个 进程 试图 去 使 用 受到 另外 一 个 进程 或 操作 系统 保护 的 存储 器 
时 所 产生 的 一 种 出 错 情况 。 

Protocol 协议 : 通信 实体 在 进行 信息 交换 时 所 要 遵守 的 一 组 规则 。 

Protocol Data Unit，PDU (协议 数据 单元 ) : 一 种 包含 协议 信息 和 数据 有 效 载荷 的 数据 通信 和 包 。 

PSTN: 参见 Public Switched Telephone Network。 

Public Switched Telephone Network ，PSTN (公用 电话 交换 网 ) : 一 种 公用 通信 设施 的 系统 ， 包 括 传 
输 线路 、 交 换 系 统 和 其 他 设备 。 

Pulse-Code Modulation ，PCM ( 脉 码 调制 ): 在 电话 通信 中 ,将 模拟 信号 转化 为 数字 信号 的 一 种 方 
法 。 模 拟 信号 采样 频率 是 8000 次 / 秒 。 在 每 次 采样 时 ， 都 为 信号 波 的 值 分 配 一 个 适合 于 数字 传输 的 二 
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进 制 值 。 参 见 Quantization。 

QAM， 参见 Quadrature Amplitude Modulation 。 

QIC; 参见 Serpentine Recording。 

Quadrature Amplitude Modulation( 正 交 幅 度 调制 )， 一 种 信号 调制 方法 ， 同 时 改变 载波 信号 的 相位 
和 振幅 进行 数字 信息 编码 。 

Quantization (量化 ): 将 一 组 输入 映射 到 一 组 输出 上 的 近似 函数 。 通 常 是 把 实数 (或 连续 模拟 信 
号 ) 值 转化 为 整数 值 ， 使 得 这 些 输入 值 在 数字 介质 中 是 可 以 表示 的 。 

Queue (队列 ) : 一 种 为 先 来 先 服务 (FIFO) 的 数据 处 理 方式 而 优化 设计 的 数据 结构 。 队 列 结构 按 
照 元 素 到 达 队 列 时 的 相同 顺序 移 走 队列 中 的 元 素 。 

Race Condition (竞争 状态 ) : 数据 最 终 的 状态 并 不 取决 于 更 新 的 正确 性 ， 而 是 取决 于 访问 数据 顺序 
的 情况 。 : 

Radix Complement ( 补 码 ): 已 知 一 个 数值 N 占据 4 位 ， 基数 为 -，N 的 补 码 被 定义 为 : 到 一 N， 对 
于 N 关 0; 而 N=0 时 ， 补 码 为 0。 . 

Radix Point (小 数 点 )， 用 来 区 别 数 的 整数 部 分 和 小 数 部 分 的 分 隔 符 。 

RAID (独立 元 余 磁盘 阵列 )， 一 种 通过 使 用 大 量 廉价 的 (独立 的 ) 小 磁盘 来 代替 -一 个 昂贵 的 大 磁盘 
来 提高 可 靠 性 和 性 能 的 存储 系统 。 这 个 系统 最 初 的 名 字 为 ， 宛 余 廉价 磁盘 阵列 。 现 在 ，RAID 通常 被 
解释 为 独立 见 余 磁盘 阵列 。 

RAID-0， 也 称 为 磁盘 跨 区 技术 ， 把 数据 分 放 到 几 个 磁盘 的 条 带 上 。RAID-0 没有 元 余 。 

RAID-1: 也 称 为 磁盘 镜像 技术 ， 把 数据 的 两 份 副本 分 别 写 到 两 个 独立 的 磁盘 上 。 

RAID-10: RAID-0 分 条 技术 和 RAID-1 镜像 技术 的 结合 。RAID-10 具有 优良 读 取 性 能 ， 同 时 提供 
最 佳 的 可 用 性 。 

RAID-2: 包含 一 组 数据 驱动 器 和 一 组 海 明 驱 动 的 RAID 系统 。 数 据 的 一 位 被 写 人 到 一 个 数据 驱动 
器 中 ， 同 时 海 明 码 驱动 器 为 数据 驱动 器 提供 错误 恢复 信息 。RAID-2 是 一 种 理论 上 的 RAID 设计 ， 没 有 
进行 商业 实现 。 

RAID-3:， 一 种 比较 流行 RAID 系统 ， 采 用 每 次 一 位 的 方法 把 数据 分 别 存放 到 所 有 的 数据 驱动 器 上 ， 
同时 利用 一 个 驱动 器 来 存储 一 个 简单 的 奇偶 校 验 位 。 利 用 硬件 对 每 个 数据 位 上 使 用 XOR 操作 可 以 很 快 
地 完成 这 种 奇偶 校 验 位 的 计算 。 


RAID-4， 一 种 理论 上 的 RAID ( 像 RAID-2)。 一 个 RAID-4 的 阵列 ， 与 RAID-3 一 样 ， 由 一 组 数据 . 


磁盘 和 一 个 奇偶 校 验 磁 盘 组 成 。 不 是 采用 每 次 一 位 的 方法 将 数据 写 人 到 所 有 的 数据 驱动 器 ，RAID-4 是 
按照 统一 大 小 的 条 带 方式 写 人 数据 ， 就 像 RAID-0 中 所 描述 的 ， 在 所 有 的 数据 驱动 器 上 都 生成 -个 条 
带 。 条 带 中 的 各 个 数据 位 相互 进行 异 或 (XOR) 操作 生成 奇偶 校 验 的 条 带 。 从 本 质 寺 来 说 ，RAID-4 
是 带 有 奇偶 校 验 的 RAID-0。 

RAID-5， 一 种 构建 在 RAID-4 基础 上 的 流行 RAID 系统 ， 它 的 奇偶 校 验 磁盘 分 布 在 整个 磁盘 阵列 。 

RAID-6: 一 种 RAID 系统 ， 其 中 对 于 每 一 模 列 (或 水 平行 ) 的 驱动 器 采用 了 两 组 纠 错 条 带 。 除 了 
奇偶 校 验 外 ， 还 使 用 Reed-Soloman 纠 错 编码 增加 了 第 二 层 的 保护 。 

RAM，Random Access Memory (随机 访问 存储 器 ) : 在 计算 机 土 用 来 存储 程序 和 数据 的 一 种 易 失 性 
( 非 永久 性 ) 的 存储 器 。 每 个 存储 单元 都 有 一 个 独一无二 的 地 址 。 

RAMAC，Random Access Method of Accounting and Control (会 计 和 控制 随机 存 取 计算 机 )， RAM- 
AC 是 在 1956 年 由 IBM 公司 发 布 的 第 一 台 商 用 的 磁盘 计算 机 系统 。 

Real-Time System (实时 系统 ) : 一 种 处 理 物理 事件 的 实时 数据 的 计算 机 系统 ， 由 于 将 与 物理 事件 
发 生 同 时 反应 ， 所 以 这 种 系统 要 求 有 严格 的 定时 限制 。 在 硬 实时 系统 中 ， 不 能 有 定时 错误 发 生 。 如 果 
不 能 满足 时 限 的 要 求 ， 则 可 能 会 有 致命 的 结果 。 而 在 软 实时 系统 中 ， 也 要 满足 时 限 的 要 求 。 但 是 如 果 
超过 了 时 限 约束 ， 还 不 至 于 导致 灾难 性 的 后 果 。 
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Recording Mode 《记录 模式 ): 参见 CD Recording Mode。 

Reed - Soloman (RS) (里 德 -所 罗 门 编码 )， 可 以 被 认为 是 一 种 CRC 编码 ， 但 它 是 对 整个 字符 进行 
操作 ， 而 不 是 只 对 几 个 位 进行 操作 。RS 编码 ， 与 CRC 编码 一 样 ， 是 -一 种 系统 性 的 编码 ， 奇偶 校 验 字 
节 会 被 加 到 一 个 信息 字 节 块 的 后 面 。 

Reentrant Code (可 重 和 人 代码)， 可 使 用 不 同 数据 的 一 种 代码 。 

Refresh Rate (刷新 率 ) : 在 屏幕 上 一 个 图 像 被 重复 显示 的 速率 。 

Register (寄存 器 ): 一 种 存储 二 进 制 数据 的 硬件 电路 。 寄 存 器 位 于 CPU 里 面 ， 速 度 非常 快 。 有 些 
寄存 器 是 用 户 可 见 的 ， 有 些 是 用 户 不 可 见 的 。 

Register Addressing (寄存 器 寻 址 ) : 一 种 寻 址 模式 。 在 寄存 器 寻 址 方式 中 ， 寄 存 器 中 的 内 容 作 为 一 
个 操作 数 。 

Register Indirect Addressing (寄存 器 间接 寻 址 ) : 一 种 寻 址 模式 。 寄 存 器 中 的 内 容 用 作 一 个 指向 操 
作 数 实际 存储 位 置 的 指针 。 

Register Transfer Notation ，RTN (寄存 器 传输 表示 法 )， 也 称 为 Register Transfer Language (RTL)， 
寄存 器 传输 语言 :用 来 描述 微 操 作 行为 的 一 种 符号 表示 法 。 

Register Window Sets (寄存 器 窗口 组 ): 也 称 为 重奏 寄存 器 窗口 〈Overlapped Register Windows): 
是 在 RISC 体系 结构 中 使 用 的 一 种 技术 ， 通 过 简单 地 改变 当前 的 执行 过 程 对 不 同 寄存 器 的 可 见 性 来 实 

Register-Memory Architecture (寄存 器 -存储 器 体系 结构 ) : 一 种 计算 机 的 体系 结构 ， 要 求 至 少 有 一 
个 操作 数位 于 寄存 器 中 ， 而 另 一 个 操作 数位 于 存储 器 中 。 

Repeater (转发 器 ): 一 种 OSI 参考 模型 中 第 1 层 的 设备 ， 用 来 对 长 距离 网 络 电缆 中 传输 的 信号 进 
行 放 大 。 - 

Replacement Policy (置换 策略 )， 一 种 用 来 选择 一 个 要 被 置换 的 高 速 缓存 牺牲 块 或 页 面 的 策略 。 这 
种 策略 在 组 关联 高 速 缓存 和 分 页 技术 中 是 必需 的 。 

Request for Comment (请 求 注解 )， 参 见 Internet Engineering Task Force。 

Resident Monitor ( 常 驻 监控 程序 ): 一 种 早期 类 型 的 操作 系统 ， 允 许 程序 能 够 在 没有 人 为 干预 ( 除 
了 在 读 卡 机 上 放 上 一 组 卡片 外 〉 的 情况 下 被 处 理 。 它 是 现代 操作 系统 的 前 身 。 

Resource Conflict (资源 冲突 )， 如 果 两 条 指令 需要 使 用 同一 个 资源 ， 就 会 发 生 资 源 冲 突 。 资 源 冲 突 
会 减 慢 流水 线 的 CPU 速度 。 

Response Time (响应 时 间 ) : 一 个 系统 或 者 是 一 个 系统 部 件 执行 某 项 任务 所 需要 的 时 间 

Reverse Polish Notation，RPN《〈 反 向 波兰 表达 式 ): 也 称 为 后 缀 表示 法 。 一 种 操作 符 和 操作 数 的 排 
序 方法 ，RPN 把 操作 符 放 在 操作 数 后 面 ， 例 如 23 十 。 

RISC，Reduced Instruction Set Computer (精简 指令 集 计 算 机 ): 一 种 计算 机 体系 的 设计 思想 ， 每 个 
计算 机 的 指令 只 完成 一 种 操作 ， 所 用 指令 的 大 小 相同 ， 指 令 的 体系 结构 的 区 别 很 小 ， 而 且 所 有 的 算术 
运算 都 必须 在 寄存 器 之 间 来 完成 。 

RLL: 参见 Run-Length-Limited。 

Robotic Tape Library (自动 磁带 库 ) : 也 称 为 磁带 仓库 ， 一 个 自动 磁带 库 系统 可 以 装载 和 人 印 下 ， 并 
且 跟 踪 记 录 〈 编 目录 ) 大 量 的 磁带 盒 。 自 动 磁带 库 的 总 容量 达到 几 百 千 兆 字 节 ， 并 且 根 据 用 户 的 请 求 ， 
在 不 到 半分 钟 的 时 间 内 能 够 装载 一 个 磁带 盒 。 

Rock's Law (洛克 定律 ): 摩尔 定律 的 -一 个 推论 ， 它 说 明了 用 来 制造 半导体 芯片 的 主要 设备 的 成 本 
费用 将 每 4 年 增加 一 倍 。 

ROM，Read-only Memory 〈 只 读 存储 器 ) : 一 种 可 以 永久 性 地 保留 数据 的 存储 器 。 

Rotational Delay (旋转 延迟 ): 将 一 个 目标 筷 区 定位 到 磁盘 读 写 头 的 下 方 所 需要 的 时 间 。 

Router (路 由 器 ): 一 种 最 少 可 以 连接 两 个 网 络 的 复杂 硬件 设备 ， 路 由 器 可 以 决定 数据 包 应 该 被 发 
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送 的 目的 地 。 

Run-length-limited，RLL (运行 长 度 限制 编码 )， 一 种 编码 方法 。 在 这 里 ， 一些 块 字 符 编码 字 ， 例 如 
ASCII 或 EBCDIC， 会 被 转换 成 一 些 专 门 设计 的 限制 编码 中 出 现 连续 0 的 个 数 的 编码 字 。RLL (d, &) 
编码 允许 在 任何 一 对 连续 1 之 间 最 少 有 a 个 和 最 多 有 上 个 连续 的 0 出现 。 

SCAN (C-SCAN) :一 种 磁盘 调度 算法 。 在 SCAN 算法 中 ， 磁 盘 臂 连续 不 断 地 扫描 磁盘 的 表面 ， 直 
到 过 到 服务 队列 中 请 求 的 磁道 时 才 会 停止 。 这 种 方法 又 称 为 电梯 算法 ， 因 为 它 非常 类 似 于 摩天 大 大 中 
的 电梯 服务 乘客 的 方式 一 样 。SCAN 有 一 种 变 体 ， 称 为 C-SCAN (循环 SCAN)， 这 里 将 磁盘 上 的 磁道 
0 看 成 是 与 最 大 编号 的 磁道 相 邻 的 磁道 。 

SCSI，Small Computer System Interface (小 型 计算 机 系统 接口 )， 一 种 计算 机 接口 技术 ， 人 允许 多 个 
设备 连接 成 菊花 链 形 式 ， 并 且 通 过 一 个 单一 主机 适配器 对 这 些 设备 进行 单独 编 址 。 现 在 ， 人 们 已 经 通 
过 SCSI-3 的 结构 模型 (SAM) 扩展 了 风 种 连接 方法 。SAM 是 一 种 带 有 协议 的 分 层 系统 ， 可 以 实现 层 
与 层 之 间 的 通信 。SAM 还 将 串 行 存储 器 体系 结构 (SSA)、 串 行 总 线 (也 称 为 IEEE 1394， 或 火线 )、 
光纤 信道 和 类 属 包 协议 (GPP) 合并 成 统一 的 体系 结构 模型 。 

SDH: 参见 Synchronous Digital Hierarchy。 

SDRAM，Synchronous Dynamic Random Access Memory (同步 动态 随机 存储 器 ): 与 经 过 优化 的 处 
理 器 总 线 的 时 钟 速率 达到 同步 的 存储 器 。 

Secondary Memory (辅助 存储 器 ) : 远离 CPU 位 于 系统 本 身 之 外 的 一 种 存储 器 。 例 如 ,磁盘 、 磁 
带 和 CD-ROM 等 。 

Seek Time ( 寻 道 时 间 ) : 磁盘 臂 定 位 到 目标 磁道 所 需 的 时 间 。 

Segment Table ( 段 表 ) : 一 个 记录 进程 段 的 物理 位 置 的 表 。 

Segmentation (分 段 ) :类似 于 分 页 ， 区 别 在 于 ， 不 是 把 虚拟 地 址 空间 分 为 相等 的 和 固定 大 小 的 页 
面 ， 以 及 把 物理 地 址 空间 分 为 相等 大 小 的 页 帧 ， 而 是 把 虚拟 地 址 空间 划分 为 一 些 逻 辑 的 、 可 变 长 度 的 
单元 (或 称 为 段 (segment))。 

Self-Relative Addressing ( 自 相 对 和 寻 址 ): 一 种 寻 址 模式 ， 需 要 从 当前 指令 中 计算 出 操作 数 的 地 址 作 
为 一 个 偏 移 量 。 

Semantic Gap (语义 图 )， 一 种 存在 于 计算 机 物理 部 件 和 高 层 语言 之 间 的 逻辑 图 。 

Sequential Circuit (时 序 电路 ) : 一 种 逻辑 电路 部 件 ， 时 序 电 路 的 输出 不 仅 与 当前 的 输入 有 关 ， 而 且 
还 与 以 前 的 输入 有 关 。 

Serial Communication 〈 串 行 通信 ) ， 一 种 传输 数据 的 方法 ， 每 次 只 传输 数据 字 节 的 一 位 。 串 行 通信 
是 异步 通信 。 在 传输 介质 中 ， 串 行 通 信 并 不 要 求 单独 定时 信号 。 比 较 并 行 传输 。 

Serial Storage Architecture (品行 存储 器 体系 结构 )， 参见 SSA。 

Serpentine Recording( 蛇 形 (曲线 ) 记录 法 ): 一 种 将 数据 位 放置 到 磁带 介质 上 的 “长 度 智能 
(length-wise)” 方 法 。 每 个 字 节 都 要 沿 着 磁带 的 长 边 平行 对 齐 。 目 前 流行 的 蛇 形 线 磁带 的 格式 包括 数 
字 线 性 磁带 、DLT 和 1/4 英寸 卡 式 磁 带 (QIC)。 

Server Consolidation (服务 器 整合 ) : 将 多 个 服务 器 (通常 是 小 型 服务 器 ) 集成 为 一 个 服务 器 〈 通 
常 是 大 型 服务 器 ) 的 过 程 。 

Server Farm (服务 器 站 ) : 一 个 由 大 量 小 型 服务 器 组 成 的 大 型 计算 机 设施 的 管理 环境 。 

Service Access Point (SAP) (服务 访问 点 ): 在 通信 会 话 过 程 中 用 来 识别 请 求 的 协议 服务 的 一 个 数 
值 。 在 TCP 协议 中 ，SAP 是 一 个 被 称 为 端口 的 数值 。 

Set Associative Cache (组 关联 高 速 缓存 ): 也 称 为 N 路 的 组 关联 存储 器 (n-way Set Associative 
Cache) 。-- 种 高 速 缓存 的 映射 方案 ， 把 高 速 缓存 划分 为 一 些 关联 存储 器 的 空间 块 组 ， 主 存储 器 会 按照 
模块 的 方式 映射 到 一 个 给 定 的 高 速 缓存 组 。 

Set Field (组 域 ) : 地 址 中 用 来 指定 相应 的 高 速 缓存 组 的 部 分 。 





428 大 语 表 





Shannon's Law (香农 定律 ) : 1948 年 ， 香 农 证 明了 ， 一 个 非 理 想 的 传输 介质 的 单传 输 容量 ， 可 以 
用 公式 表示 为 ， 最 大 数据 传输 率 一 带宽 Xiog: [1 十 (信号 dB 二 噪音 dB)] 波 特 。 

Shared Memory Systems (共享 存储 器 系统 ): 一 种 存储 器 系统 。 所 有 的 处 理 器 都 可 以 访问 一 个 全 局 
存储 器 ， 通 过 一 些 共 享 变量 进行 通信 。 

Shortest Seek Time First (SSTF) (最 短 寻 道 时 间 优 先 ) :一 种 磁盘 调度 算法 ， 通 过 算法 安排 访问 请 
求 ， 首 先 服务 离 磁盘 臂 的 当前 位 置 最近 的 请 求 磁道 。 

Shuffle Network ( 洗 牌 网 络 ) ， 参见 Multistage Interconnection Network 。 

Signal-to-Noise Ratio〈 信 噪 比 ) : 一 种 通信 信道 质量 的 度量 方法 。 信 品 比 与 线路 上 载波 信号 的 频率 
成 正比 (频率 越 高 ， 信 品 比 就 越 大 )。 从 数学 上 ， 信 品 比 (dB) =10logio (信号 dB 噪声 dB) 。 

Signed Magnitude (符号 幅 值 表示 法 ): 一 种 二 进 制 数 的 表示 方法 ， 最 左边 的 位 为 符号 位 ， 其 余 位 由 
数 的 绝对 值 组 成 〈 或 称 为 幅 值 ) 。 

Significand: 参见 Mantissa。 

SIMD ，Single Instruction，Multiple Data ( 单 指令 多 数据 ) : 一 种 计算 机 体系 结构 ， 它 具有 单 点 控制 ， 
同时 对 多 个 数据 值 来 执行 同一 条 指令 。 例 如 ， 矢 量 处 理 器 和 阵列 处 理 器 。 

SISD，Single Instruction，Single Data ( 单 指 令 单数 据 )， 一 种 计算 机 体系 结构 。 这 种 体系 结构 只 有 
一 个 单一 指令 流 和 一 个 唯一 的 数据 流 。 包 括 现在 应 用 在 大 多 数 PC 机 中 的 冯 ，。 诺 伊 曼 体系 结构 。 

SLED，Singie Large Expensive Disk (大 型 昂贵 的 单 磁盘 ): 随 着 RAID 概念 而 出 现 的 一 个 术 诸 。 
SLED 系统 相对 于 RAID 系统 来 说 ， 可 靠 性 较 低 ， 性 能 也 比较 差 。 

Small Computer System Interface (小 型 计算 机 系统 接口 ): 参见 SCSI。 

SMP，Symmetric Multiprocessors (对 称 多 处 理 器 ) :一 种 MIMD 的 共享 存储 器 体系 结构 。 

SNA: 参见 Systems Network Architecture。 

SONET (同步 光纤 网 络 ) ， 一 种 为 工 载波 系统 构建 的 光纤 传输 标准 。 

SPEC (标准 性 能 评估 公司 ): SPEC 日 的 是 为 计算 机 性 能 测试 建立 公正 的 和 现实 的 方法 。SPEC 负 
责 产 生 相 应 的 基准 套件 ， 内 容 包括 文件 服务 器 、Web、 桌 面 计 算 环 境 、 企 业 级 的 多 处 理 器 系统 、 超 型 
计算 机 、 多 媒体 和 图 形 增强 系统 。 

Speculation Execution (推测 执行 ): 在 确定 指令 是 否 需 要 执行 之 前 ， 先 取出 指令 并 在 流水 线 中 开始 
执行 的 一 种 行为 。 如 果 发 现 预测 不 正确 ， 则 必须 要 最 消 预测 执行 。 

Speedup (加 速 )， 参见 Amdahl's Law。 

SPMD，Single Program ，Multiple Data (单程 序 多 数据 )， 一 种 弗 林 分 类 法 的 扩展 ， 这 种 体系 结构 由 
多 个 处 理 器 组 成 ， 每 个 处 理 器 有 自己 的 数据 组 和 程序 存储 器 。 

Spooling( 假 脱 机 ， 外 围 设备 联机 并 发 操作 ): 指 一 个 程序 在 被 送 往 打印 机 之 前 ， 先 将 要 打印 输出 
的 内 容 写 人 到 磁盘 中 ， 这 样 有 利于 弥补 CPU 速度 和 打印 机 速度 之 间 的 巨大 差异 。 

SRAM，Static RAM (静态 随机 存储 器 ) : 只 要 电源 不 会 断 电 ，RAM 就 可 以 保持 存储 器 中 的 内 容 。 
这 与 动态 RAM 不 同 ， 动 态 RAM 要 求 不 断 刷 新 才能 保持 数据 。 

SSA ，Serial Storage Architecture ( 串 行 存 储 器 体系 结构 ): SSA 的 设计 采用 一 个 元 余 循环 的 配置 支 
持 多 个 磁盘 驱动 器 和 多 个 主机 。 由 于 这 种 宛 余 性 ， 即 使 一 个 驱动 器 或 主机 适配器 失效 ， 剩 余 的 磁盘 还 
可 以 进行 访问 。SSA 的 双 循 环 拓扑 结构 还 允许 基本 大 吐 量 加 倍 ， 从 40MB/s 增加 到 80MB/s。 由 于 光 
纤 信 道 的 使 用 ，SSA 正在 逐渐 失去 它 的 市 场 份额 。 

SSI，Small Scale integration (小 规模 集成 电路 ) : 每 个 芯片 上 有 10 到 100 个 元 件 的 集成 电路 。 

SSTF: 参见 Shortest Seek Time First。 

Stack (堆栈 ) : 一 种 简单 的 为 后 进 先 出 〈LIFO) 数据 元 素 处 理 优化 设计 的 数据 结构 。 堆 栈 结构 按 
照 元 素 进 入 堆栈 顺序 的 相反 次 序 从 堆栈 中 移 走 数 据 元 素 。 

Stack Addressing (堆栈 寻 址 ) : 一 种 寻 址 模式 ， 假 定 操作 数 在 系统 的 堆栈 中 。 
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Stack Architecture (堆栈 体系 结构 )， 一 种 使 用 堆栈 执行 指令 的 计算 机 体系 结构 ， 这 里 总 是 隐 式 地 
假定 操作 数 就 在 〈 堆 ) 栈 顶 。 

Standard Performance Evaiuation Corporation (标准 性 能 评估 公司 ): 参见 SPEC。 

Star-Connected Network 〈 星 型 网 络 ) : 一 种 所 有 的 消息 都 必须 通过 一 个 中 心 集 线 器 的 网 络 。 

Static Interconnection Network (静态 互连网 ) : 一 种 在 两 个 实体 之 间 建 立 同 定 路 径 的 网 络 。 这 两 个 
连接 实体 可 能 是 两 个 处 理 器 ， 也 可 能 是 一 个 处 理 器 和 一 个 存储 器 ， 这 两 个 实体 之 间 的 路 径 从 一 个 通信 
到 下 一 个 通信 不 能 发 生变 化 。 

Statistical Coding 统计 编码 ): 一 种 数据 压缩 方法 。 在 统计 编码 中 ， 符 号 出 现 的 频率 决定 了 输出 符 
号 的 长 度 。 符 号 出 现 的 几率 会 连同 译 码 消息 所 要 求 的 信息 一 起 被 写 人 到 文件 中 。 输 入 中 频繁 出 现 的 最 
大 符号 在 输出 中 会 变 成 最 小 符号 。 

Status Register (状态 寄存 器 ) : 一 种 专用 的 寄存 器 ， 用 来 监视 和 记录 一 些 特殊 的 条 件 ， 例 如 洲 出 、 
进位 和 借 位 等 。 

STM-1: 基本 的 SDH 信号 ， 能 够 以 155. 52Mb/s 的 速率 传输 信号 。STM 是 由 欧洲 同步 数字 体系 传 
送 的 信号。 类 似 于 北美 的 SONET 光 载 波 系统 。 

Storage Area Network (存储 器 区 域 网 络 ) : 为 数据 存储 访问 和 管理 而 专门 构建 的 网 络 。 

STS-1: 参见 SONET。 

Subnet ( 子 网 ) : 大 型 网 络 被 细 分 为 一 系列 的 子 网 。 在 TCP/IP 协议 下 ， 子 网 是 一 种 网 络 中 的 所 有 
设备 的 IP 地 址 都 具有 相同 的 前 组 的 网 络 。 

Subsystem ( 子 系统 )， 一 种 逻辑 计算 环境 通 ， 建 立 子 系统 是 为 了 方便 相关 应 用 进程 的 管理 。 

Subtrahend ( 减 数 ) : 参见 Minuend。 

Sum-of-Products Form 〈 积 之 和 形式 ): 一 种 布尔 表达 式 的 标准 形式 ， 它 是 一 组 乘积 项 的 或 (OR) 
运算 一 个 集合 。 

Superpipelining ( 超 流 水 线 ) :一 种 组 合 超标 量 和 流水 线 概 念 的 计算 机 技术 。 通 过 把 流水 线 的 步骤 
分 成 许多 更 小 的 步骤 ， 使 得 计算 机 可 以 在 一 个 时 钟 周期 内 执行 多 个 步骤 。 

Superscalar (超标 量 ): 一 种 计算 机 体系 结构 的 设计 方法 。 在 超标 量 结构 中 ，CPU 包含 多 个 ALU， 
而 且 每 个 时 钟 周期 能 够 发 出 多 条 指令 。 

Supervised Learning (监督 学 习 算法 ): 一 种 在 训练 神经 网 络 中 使 用 的 学 习 方 法 ， 这 种 学 习 方 法 是 
将 一 些 正 确 的 知识 结果 输入 神经 网 络 ， 对 神经 网 络 进行 训练 。 

Switch (交换 机 ) : 在 系统 部 件 之 间 提 供 点 对 点 的 互 连 的 一 种 设备 。 在 数据 通信 中 ， 交 换 机 是 第 2 
层 的 设备 ， 它 可 以 在 其 输入 端口 的 某 一 点 和 输出 端口 的 某 一 点 之 间 创 建 一 个 点 到 点 的 连接 。 

Switching Network (开关 网 络 ): 一 种 通过 开关 〔( 既 可 以 是 交换 开关 ， 也 可 以 是 2X2 开关) 来 连接 
处 理 器 和 存储 器 的 网 络 ， 这 个 开关 网 络 允许 动态 路 由 。 

Symbol Table〈 符 号 表 )， 由 汇编 程序 创建 的 一 个 表 ， 用 来 存放 各 个 表 之 间 和 存储 器 地 址 之 间 的 一 
一 对 应 关系 。 

Symbolic Logic (符号 逻辑 )， 参见 Boolean algebra。 

Synchronous Circuits (同步 电路 ): 一 种 时 序 电 路 ,使 用 时 钟 脉冲 对 事件 进行 排序 。 这 些 电 路 的 输 
出 值 只 能 随 着 时 钟 脉冲 的 跳动 而 发 生 改 变 。 

Synchronous Digital Hierarchy，SDH (同步 数字 体系 )， 欧 洲 使 用 的 与 SONET 对 等 的 体系 ，SDH 使 
用 的 256 位 帧 。 基 本 的 SDH 信和 号 是 STM-1， 可 以 155. 52Mb/s 的 速率 传输 信和 号。 

Synchronous Optical Network (同步 光纤 网 络 ): 参见 SONET。 

Synchronous Transport System 1 (同步 传输 系统 1) : 参见 SONET。 

Syndrome (出 错位 组 ): 一 组 错误 校 验 位 。 

Synthetic Benchmark (综合 基准 程序 ) ， 从 一 个 针对 特定 的 系统 部 件 编写 的 程序 得 到 的 性 能 度量 标 
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准 。 通 过 在 不 同 的 系统 上 运行 综合 基准 程序 ， 程 序 的 执行 时 间 结 果 会 对 所 有 测试 的 系统 产生 一 个 单一 
性 能 度量 标准 。 比 较 好 的 综合 基准 程序 有 : Whetstone、Linpack 和 Dhrystone 度量 标准 。 

System Bus (系统 总 线 ): 通常 在 PC 机 中 连接 CU、 存储器 和 其 他 所 有 内 部 组 件 的 内 部 总 线 。 

System Simulation (系统 仿真 )， 预 测 系统 各 种 行为 的 软件 模型 ， 利 用 仿真 器 建 模 无 需 使 用 真正 的 
系统 环境 。 仿 真 对 于 评估 一 些 目前 还 不 存在 的 系统 或 系统 配置 的 性 能 是 非常 有 用 的 。 

Systematic Error Detection (系统 错误 检测 ): 一 种 错误 检测 方法 ， 把 一 些 错误 校 验 位 加 到 原来 的 信 
息 字 节 的 后 面 。 

System Network Architecture，SNA (系统 网 络 体系 结构 ): 一 种 由 IBM 公司 发 明 的 早期 专用 网 络 技 
术 。 这 个 系统 最 初 是 由 一 些 哑 终 端 组 成 的 ， 利 用 一 个 通信 控制 器 对 终端 设备 进行 轮流 测试 〈 轮 询 ) 。 接 
着 ， 这 个 通信 控制 器 会 与 一 个 连接 到 主机 计算 机 的 前 端 处 理 器 进行 通信 。 

Systolic Array (脉动 阵列 )，SIMD 计算 机 的 一 种 变化 形式 。 脉 动 阵列 采用 一 种 简单 处 理 器 的 大 型 
阵列 ， 对 数据 流 使 用 矢量 流水 线 作 业 ， 而 且 具 有 高 度 的 并 行 性 。 

T Carrier System (TI 载波 系统 ) : 一 种 数字 载波 系统 ， 采 用 时 分 复 用 技术 来 产生 不 同 的 传输 速率 。 
目前 ， 只 有 T-1 (1. 544Mb/s) 和 T-3 (6. 312Mb/s) 被 广泛 使 用 。 许 多 装置 都 被 移植 到 光纤 载波 上 。 

Tag Field (标记 域 ) ， 地 址 中 用 来 指定 高 速 缓存 标记 的 部 分 。 

Tape Silo (磁带 库 )， 参 见 Robotic Tape Library。 

TCM; 参见 Trellis Code Modulation 。 

TCO， 参见 Total Cost of Ownership。 

TCP: 网 络 中 使 用 的 一 种 面向 连接 协议 。TCP 是 一 个 自我 管理 的 协议 ， 能 够 确保 准确 顺序 的 数据 
段 传输 。 

TDM， 参 见 Time Division Multiplexing 。 

Thrashing (摆动 ) ， 当 所 需 的 数据 块 或 页 被 频繁 地 放 人 存储 器 中 但 又 立即 被 蔡 换 时 ， 就 发 生 了 摆动 
现象 。 

Throughput (吞吐 量 )， 在 不 会 造成 响应 时 间 有 重大 降低 的 情况 下 ， 一 个 系统 可 以 执行 并 发 任务 的 
数目 的 一 种 度量 。 

Thunking( 形 实 转换 )， 在 Microsoft Windows 系统 中 ， 把 16 位 指令 转换 为 32 位 指令 的 一 个 过 程 。 

Time Division Multiplexing，TDM (时 分 复 用 )， 一 种 多 路 技术 方法 ， 将 单个 通信 介质 或 载波 划分 成 
信道 ， 分 配给 分 立 不 相关 的 连接 。 每 个 连接 会 被 指定 一 个 小 的 、 重 复 的 传输 时 间 段 。 

Timesharing (分 时 共享 ) : 一 种 多 用 户 计 算 机 系统 。CPU 在 用 户 进 程 之 间 切 换 速度 非常 快 ， 为 每 个 
用 户 分 配 一 个 小 段 的 时 间 片 〈 处 理 器 的 小 部 分 时 间 ) 。 

Timeslice (时 间 片 ); 参见 Timesharing 。 

Total Cost of Ownership (总 体 拥有 成 本 ): 一 个 计算 机 系统 在 一 个 给 定 的 时 间 周 期 内 ， 所 需 的 总 费 
用 ， 这 个 时 间 段 也 许 会 超过 系统 的 预期 寿命 。 一 个 有 用 的 TCO 数字 至 少 要 包括 以 下 的 内 容 : 购买 特定 
的 系统 配置 的 费用 ， 其 中 包括 系统 软件 费用 ， 预 期 的 系统 扩展 和 升级 的 费用 ， 还 有 硬件 和 软件 的 维护 
费用 ， 操 作 人 员 的 人 工 ， 以 及 设施 的 费用 ， 其 中 包括 房屋 租用 、 电 源 消耗 和 空调 系统 的 费用 。 

TPC (事务 处 理 委员 会 ) ，TPC 委员 会 专门 负责 为 支持 事务 处 理 ，Web 商务 和 数据 仓库 (决定 支持 
系统 ) 的 服务 器 创建 各 种 基准 套件 。 

Transaction Processing Council (事务 处 理 委员 会 ): 参见 TPC。 

Transfer Time (转移 时 间 ) ; 访问 时 间 与 从 硬盘 上 实际 读 取 数 据 所 花费 的 时 间 之 和 。 和 转移 时 间 会 随 
着 读 取 数据 方式 不 同 而 发 生变 化 。 

Transistor (晶体 管 )， 真空 三 极 管 的 一 种 固体 形式 ， 用 来 放大 信号 ， 接 通电 路 或 关闭 电路 。 在 第 二 
代 计 算 机 中 使 用 晶体 管 技术 。 

Translation Look-aside Buffer，TLB (转换 旁 视 缓冲 器 ) : 也 称 为 快 表 ， 一 个 页 表 的 高 速 缓存 。 它 的 
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入 口 条 目 由 一 些 数据 对 组 成 ， 即 由 虚拟 页 数 和 物理 帧 数组 成 。 

Transmission Control Protocal (传输 控制 协议 ): 参见 TCP。 

Transparet Bridge (透明 网 桥 ): 一 种 复杂 的 网 络 设 备 ， 有 能 力 知 道 每 个 网 络 段 上 各 个 设备 的 地 址 。 
透明 网 桥 也 能 够 提供 管理 信息 ， 例 如 汇报 吞吐 量 。 

Transport Latency (传输 延迟 ) : 消息 在 网 络 中 所 花费 的 时 间 。 

Trellis Code Modulation，TCM 〈 格 码 调制 ): 一 种 信和 号 调制 方法 ， 同 时 改变 载波 信号 的 相位 和 振幅 
来 编码 数字 信息 。TCM 非常 类 似 于 QAM， 但 是 有 一 点 不 同 的 是 ，TCM 对 每 个 信号 点 都 增加 一 个 奇 
偶 校 验 位 ， 允 许 在 传输 的 信号 中 进行 某 些 前 向 误差 校正 。 

Trie 〈 树 形 数据 结构 ) ;一 种 非 循环 的 ”又 树 的 数据 结构 ， 将 部 分 数据 关键 字 的 值 存放 在 每 一 个 节 
点 。 关 键 字 的 值 被 组 装 会 继续 沿 着 Trie 树 搜索 。 内 部 节点 包含 足够 多 的 指针 数 来 指引 搜索 所 要 求 的 关 
键 字 或 者 导向 树 的 下 一 层 。 

Truth Table ( 真 值 表 ) : 一 个 描述 逻辑 函数 的 表 ， 以 表格 的 形式 说 明了 所 有 可 能 的 输入 值 和 函数 输 
出 结果 之 间 的 关系 。 

Twisted Pair ( 双 绞 线 ): 一 对 绝缘 的 导线 相互 扭 在 一 起 ， 来 传输 电信 号。 

Two's Complement Notation 〈 补 码 表示 法 )， 又 称 为 2 的 补 码 表示 法 ， 是 一 种 用 来 表示 带 符号 的 二 
进 制 数值 的 方法 。 正 数 简单 地 用 符号 幅 值 表示 法 来 表示 ， 对 于 负数 ， 则 将 相应 的 正 数 表示 中 的 所 有 的 
位 翻 位 〈 按 位 取 反 ) 后 再 加 1。 

ULSI，Ultra Large Scale Integration (超大 规模 集成 电路 ): 每 个 芯片 上 有 多 于 100 万 个 元 件 的 集成 
电路 。 

Underfiow (下 溢 ) : 参见 Divide Underflow。 

Unguided Transmission Media ( 非 导向 性 传输 介质 ): 能够 传输 数据 通信 信号 的 电磁 波 或 光波 等 载波 
介质 。 这 种 媒体 类 型 包括 无 线 广播 、 微 波 、 卫 星 通信 和 空间 光 通 信 。 

Unicode: 一 种 16 位 的 国际 字符 编码 ， 能 够 表示 世界 上 每 一 种 语言 。 统 一 字符 集中 低 的 127 位 字 
符 和 ASCII 字符 集 的 字符 是 完全 相同 的 。 

Uniform Memory Access，UMA (均匀 存储 器 访问 计算 机 ) : 一 种 共享 存储 器 的 MIMD 计算 机 。 这 种 
计算 机 中 的 任何 一 个 处 理 器 访问 任何 一 个 存储 器 需要 相同 的 时 间 。 

Universal Gate (通用 门 电路 ) : 之 所 以 称 为 通用 门 电 路 ， 是 因为 任何 数字 电路 都 可 以 仅 使 用 一 种 门 
电路 构建 而 成 。 与 非 门 (NAND) 和 或 非 门 (NOR) 都 是 通用 门 电路 的 例子 。 

Universal Serial Bus (通用 串 行 总 线 ) : 参见 USB。 

Unsupervised Learning (无 监督 学 习 算 法 ) : 在 训练 神经 网 络 中 所 使 用 的 一 种 学 习 类 型 。 这 种 学 习 算 
法 在 训练 期 间 不 向 神经 网 络 提供 正确 的 输出 。 

USB，Universal Serial Bus (通用 串 行 总 线 ): 一 种 用 于 USB 接口 的 外 部 总 线 标 准 ， 支 持 各 种 热 插 
拔 的 设备 。 

Vacuum Tube (真空 管 )， 一 种 用 在 第 0 代 计 算 机 的 不 太 可 依靠 的 技术 。 

Vector Processors〈 矢 量 处 理 器 ) :一 种 专用 的 高 度 流 水 线 作 业 的 处 理 器 ， 可 以 对 整个 矢量 和 和 气 阵 
立即 执行 非常 有 效 的 操作 。 寄 存 器 -寄存 器 类 型 的 矢量 处 理 器 要 求 所 有 的 操作 都 要 使 用 寄存 器 作为 源 操 
作 数 和 目标 操作 数 。 而 存储 器 -存储 器 类 型 的 矢量 处 理 器 允许 来 自 存储 器 的 操作 数 被 直接 发 送 到 算术 单 
元 中 。 

Virtual Address (虚拟 地 址 ) :为 了 响应 程序 的 执行 ， 由 CPU 生成 的 一 种 逻辑 地 址 或 程序 地 址 。 无 
论 CPU 何 时 产生 地 址 ， 总 是 位 于 虚拟 地 址 空间 。 

Virtual Machine (虚拟 机 ) : 〈I) 一 种 假想 的 计算 机 ; (2) 一 种 自 包 含 的 操作 环境 。 这 种 环境 会 给 人 
一 种 存在 于 一 个 独立 的 物理 机 器 幻想 ;(3) 一 台 实 际 机 器 的 一 种 软件 仿真 。 

Virtual Memory (虚拟 存储 器 ): 一 种 利用 硬盘 扩展 RAM 的 方法 ， 这 样 可 以 增加 程序 进程 的 可 用 地 
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址 空间 。 

VLIW (Very Long Instruction Word) Architecture ( 超 长 指令 字体 系 结构 ): 一 种 体系 结构 的 特性 。 在 
超 长 指令 字 结 构 中 ， 每 个 指令 都 能 够 规定 多 个 标量 操作 。 

VLSI，Very Large Scale Integration (超大 规模 集成 电路 ) ， 每 个 芯片 上 有 多 于 10000 个 部 件 的 集成 
电路 。 这 种 技术 在 第 四 代 计 算 机 中 使 用 。 

Volatile Memory ( 非 永久 性 〈 易 失 性 ) 存储 器 )， 在 电源 断 电 后 ， 存 储 器 中 的 内 容 都 会 丢失 的 一 种 
存储 器 类 型 。 

Von Neumann Architecture ( 汉 ，。 诺 伊 曼 体系 结构 ): 一 种 存储 程序 的 计算 机 体系 结构 ， 由 CPU、 
ALU、 寄 存 器 和 主 存 储 器 组 成 。 

Von Neumann Bottleneck 〈 冯 “' 诺 伊 曼 瓶颈 )， 指 在 主 存储 器 和 CPU 控制 单元 之 间 的 只 有 单一 通道 。 
这 条 单一 通道 会 迫使 指令 周期 和 执行 周期 交替 进行 ， 这 样 常常 会 产生 瓶颈 现象 ， 或 导致 系统 的 速度 减 
慢 。 

Wall Clock Time (挂钟 时 间 ) : 也 称 为 逝去 的 时 间 ， 是 一 种 度量 计算 机 性 能 的 方法 ， 特 别 是 在 系统 
正在 运行 程序 时 ， 测 量 墙 上 的 挂钟 时 间 。 

WAN (广域网 ) :WAN 能 够 覆盖 多 个 城市 或 整个 世界 。 

Weighted Arithmetic Mean 《加权 算术 平均 数 )， 一 种 算术 平均 数 ， 通 过 结果 值 乘 以 结果 值 出 现 的 频 
率 (按照 百分比 的 形式 表示 求 得 。 加 权 算 术 平均 数 给 出 一 个 系统 性 能 的 数学 期 望 值 。 加 权 算 术 平均 
数 也 可 以 称 为 加 权 平 均 。 

Weighted Numbering System (加 权 计 数 系统 ) ， 一 种 通过 增加 基数 的 寡 来 表示 一 个 数值 的 计数 系统 。 
二 进 制 和 十 进 制 计 数 系统 都 是 加 权 计 数 系统 的 例子 。 而 罗马 数字 就 不 是 这 种 类 型 。 

Whetstone: 一 种 基准 程序 ， 是 一 种 浮 点 增强 型 的 程序 。 为 了 计算 三 角 函 数 和 指数 函数 ， 程 序 中 有 
许多 的 库 函数 调用 过 程 。 测 试 结 果 的 报告 表示 为 每 秒 钟 千 条 Whetstone 指令 (KWIPS)， 或 者 表示 为 
每 秒 钟 兆 条 Whetstone 指令 (MWIPS)。 

Wide Area Network (广域网 ) : 参见 WAN。 

Winchester Disk (Winchester 硬盘 ): 简称 硬盘 ， 是 一 种 完全 封闭 式 的 硬盘 。 这 个 名 称 来 源 于 IBM 
公司 开发 这 种 技术 时 所 采用 的 编码 名 字 (Winchester 编码 ) 。 

Word Field (Offset Field) ( 字 域 〈 或 称 为 偏 移 量 域 ) ) : 在 一 个 给 定 的 数据 块 或 页 面 中 指定 唯一 字 的 
地 址 部 分 。 

Word ( 字 ):, 一 组 可 编 址 的 连续 位 。 通 常情 况 下 ， 字 由 16 位 、32 位 或 者 64 位 组 成 。 但 是 ， 一 些 早 
期 的 计算 机 体系 及 结构 使 用 字 的 大 小 并 不 是 8 的 整数 售 。 

Word-addressabie ( 按 字 编 址 ) : 每 个 字 〈 不 必 是 每 个 字 节 ) 都 有 自己 的 地 址 。 

Write-Back ( 回 写 ) :一 种 高 速 缓存 更 新 策略 。 只 有 当 一 个 高 速 缓存 块 被 选中 要 从 高 速 缓存 中 被 移 
走时 ， 才 更 新 主 存储 器 。 人 允许 存储 的 高 速 缓存 值 与 它 相 应 的 存储 器 的 值 不 一 致 。 

Write-Through ( 写 通 )， 一 种 高 速 缓存 更 新 策略 。 每 一 次 写 操作 ， 会 同时 更 新 高 速 缓存 和 主 存储 
器 。 

Zoned-Bit Recording (区 位 记录 法 ): 一 种 增加 磁盘 容量 的 实践 方法 。 具 体 做 法 是 ， 将 磁盘 的 所 有 
扇 区 都 划分 为 大 小 基本 相同 的 单元 ， 把 更 多 的 扇 区 放置 在 外 层 的 磁道 上 而 不 是 放置 在 内 层 的 磁道 上 。 
而 其 他 类 型 的 记录 方法 是 在 磁盘 的 所 有 磁道 有 同样 数目 的 扇 区 。 
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1. 在 硬件 和 软件 之 间 ， 一 个 用 来 提供 更 快 的 速度 ， 而 另 一 个 用 来 提供 更 大 的 灵活 性 。 这 里 ， 哪 一 个 是 
硬件 ? 哪 一 个 是 软件 ? 硬件 和 软件 通过 软 硬 件 的 等 效 性 原理 相互 关联 。 是 否 有 一 个 能 够 解决 某 个 问 
题 而 另 一 个 却 不 能 解决 的 地 方 ? 

3，100 万, 或 者 105 。 

7，0.75 微米 。 


第 2 章 


1. a) 1212223 
b) 10202s 
c) 42667 
d) 6030g 
3. a) 11010. 11001 
b) 11000010. 00001 
c) 100101010. 110011 
d) 10000. 000111 
5. a) 符号 - 幅 值 ，01001101 
反 码 : 01001101 
补 码 ; 01001101 
b) 符号 - 幅 值 : 10101010 
反 码 ， 11010101 
补 码 ，11010110 
9. a) 最 大 值 正 数 :; 011111 (31) 
最 小 值 负 数 : 100000 (一 31) 
11. a) 111100 
13. a) 1001 
15. 104 
17. 提示 : 按照 如 下 方式 开始 跟踪 程序 执行 过 程 : 


— 


— ~ ~ 


J (二 进 制 ) K (二 进 制 ) 

0 ”0000 一 3 1100 

1 0001 一 4 1011 (1100 十 1110) (在 运行 反 码 加 法 时 把 上 一 个 进位 添加 到 求 和 中 ) 
2 0010 一 5 1010 (1011 十 1110) 

3 0011 一 6 1001 (1010 十 1110) 

4 0100 一 ? 1000 (1001 十 1110) 

5 0101 7 0111 (1000 十 1110) ( 洲 出 ,但 可 以 忽略 ) 


19. 0 1 1 1 1 0 1 0 误差 二 2. 4% 
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25. 
二 进 制 值 00000000 00000001 00100111 
ASCII 编码 10110010 00111001 00110101 
压缩 BCD 编码 00000000 00101001 01011100 
27. 提示 : 考虑 语言 和 存储 空间 的 兼容 性 
32. 4 


35. 第 5 位 发 生 错 误 
39. a) 1101 余数 110 
b) 111 余数 1100 
c) 100111 余数 110 
d) 11001 余数 1000 
41. 编码 字 :， 1011001011 














第 3 章 

1 a) zx y z | Zyz (TIZ)|ryz+ (Tyz) 
0 0 0 0 1 1 
0 0 1 0 1 1 
0 1 0 0 1 1 
0 1 1 0 1 1 
1 0 0 0 1 1 
1 0 1 0 1 1 
1 1 0 0 1 1 
1 1 1 1 0 1 

b) x y z yz 元 y 《3 有 十 去 y) XT (yz++ry) 

0 0 0 0 0 0 0 
0 0 1 0 0 0 0 
0 1 0 1 1 1 0 
0 1 1 0 1 1 0 
1 0 0 0 0 0 0 
1 0 1 0 0 0 0 
1 1 0 1 0 1 1 
1 1 1 0 0 0 0 

3. F(x,y,z) = rx(y++ 2) 

F(z,y,z) = rx(5 二 2) 
二 工 十 (了 十 x) 
二 工 十 弃 


5. Fl(w,r,y,2) = ryz(( 有 DNC 二 x) 十 (Wyz 十 元 ) ) 
Flw,r,y,z) = ryz((D Fz) + (wyz Tz)) 
一 T+ (PTI) (Tyr Ta)) 
二 XE 十 (( 下 十 xX)( 醒 yz 干 去 )) 
到 十 了 十 Zz 十 (( 下 十 XT) (本 yz 开 )) 
二 区 十 了 十 z 十 (( 陀 十 X)((w 十 3 十 Z)x)) 
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7. 错 。 一 种 方法 是 使 用 真 值 表 ， 而 另外 一 种 更 具 挑 战 性 的 方法 是 利用 下 面 的 关系 通过 恒等式 来 证 明 。 
aXORb = w+ 
9. b) (ZX 十 y)(ZX 十 3)( 元 十 z) 
一 X(T 十 节 )( 环 十 2) 十 y(X 十 了)( 序 十 之) 
二 X(XF 十 IY 十 季 十 吏 ) 十 y(XE 十 XZ 十 区 十 下 ) 
二 x(xz 十 ZT7y 十 下 ) 十 y(xz 十 区 十 下) 
一 Xrz 十 XZ 十 X3z 十 Tyz 十 无 y 了 十 yz 
= Xz 十 XZ 十 Tyz 
Tz(1 十 3 十 y) 一 zz 


11. a) ZTyz 十 zz = Eyz+ zz(1) 一 致 律 
= zyz 二 xz(y 十 3) 互补 律 
一 TZyz 十 xyz + xyz 分 配 律 和 交换 律 


一 Royz 十 (zyz 十 Zyz) 十 zz ， 宕 等 律 
二 (Tyz 十 Zyz) 十 (zyz 十 xz) 结合 和 
二 (十 XT)y2 十 (y 十 了)xz 分 配 律 ( 二 次 应 用 ) 
= 1(yz) 十 (1)zz 互补 律 
= yz 二 xz 一 致 律 
b) (zz 干 力 ( 去 干 习 = (5)(F5) 德 摩根 律 
= (zy)(ry) 双 补 律 
= (zr) (yy) 交换 律 和 结合 律 


= (0)(0) 互补 律 (2 次 ) 
=0 将 等 律 
Cc) (Cz) (元 )y) 一 《〈( 元 ) (CZ)y) 双 补 律 
= (0y) 互补 律 
= (0) 零 律 
一 1 补 码 的 定义 


13. a) Zy 十 ZX 


17. xy 十 息 十 光 
= Ty 十 Tz 十 (1)yz 
二 xy 十 到 十 (Zz 十 TT)yz 
= ZXy 十 枚 十 XxXyz 十 yz 
= (zy 二 ZXyz) 二 (zz 二 zyz) 
二 ZXy(1 十 z) 十 Tz(1 十 y) 
一 Xy 十 zz 
18. TIZ+EyETryz+iryz 
21.( 没 有 简化 的 ) 
a) 未) 干 并 7y 束 一 工 广 十 zx 十 未 7 十 7 十 歼 
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29. 


~ OOP~ OO ~| 





bs 
0 
0 
0 
0 
1 
1 
i 


OO OO”~ OO ol 
OO ~ OP~" OP~“ OIN 


35. 赋予 输入 的 值 〈 卡 的 编码 方法 ) 决定 了 每 个 读 卡 器 的 设计 。 一 种 编码 方法 如 下 表 所 示 。 








基于 上 面 的 编码 ， 服 务 器 机 房 的 读 卡 器 可 以 按 如 下 的 方式 实现 : 


人 


记 -~ 
这 个 设计 的 其 他 部 分 ? 


37. 从 如 下 图 所 示 对 触发 器 之 间 的 连 线 进行 编号 开始 : 


位 
站。 大 
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接 通 的 线路 








0 5, 6, 7, 8 
1 ?777? 
8 ?777 
39. 
A B X A B 
0 0 0 0 0 
0 0 1 0 0 
0 1 0 0 0 
0 1 1 0 0 
1 0 0 1 1 
1 0 1 0 1 
有 1 0 . 0 
1 1 1 0 0 
41. 
A B X A B 
人 0 0 1 0 
0 0 1 0 0 
0 1 0 1 0 
0 1 0 0 
1 0 0 1 1 
1 0 1 和 1 
1 1 0 L 0 
1 1 1 0 
第 3 章 专题 


3A. 1, a) zz+ 2z 
b) 元 z 十 云 y 十 工 可 过 

3A. 5. 未 7z 十 元 yz 十 并 yz 十 Zyz 
Zz (5 十 y) 十 zz (7 十 y) 
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TZ 十 X% 
ZzZ(T 二 xXx) 一 z 


3A. 6，a) Z 十 三 


(没有 包括 “无 关 (don’t care)” 条 件 ， 因 为 对 问题 并 没有 多 大 帮助 。) 


第 4 章 


3, a) 总 字 节 为 ， 2MX4 字 节 王 2X220X22 盖 223 所 以 ， 一 个 地 址 需要 23 位 。 
b) 2M 字 = 王 2X220 一 221， 所 以 ， 一 个 地 址 需要 21 位 。 


6. a) 16 (2 列 8 行 ) 
b) 2 
c) 256K 一 218， 所 以 18 位 
d) 8 
e) 2M 一 22 ， 所 以 21 位 
f) 存储 器 组 0 (000) 
g) 存储 器 组 6 (110) 


9.， a) 220 字 节 ， 需 要 20 位 地 址 ， 编 址 范围 : 地 址 0 到 220 一 1 。 


b) 只 有 23 字 ， 编 址 范围 : 地 址 0 到 22 一 1 
12. 提示 : 考虑 数据 和 地 址 之 间 的 差别 。 
14. 





15，a. i) 存储 007 
18. 提示 : 把 FOR 循环 变 成 WHILE 循环 。 
22. 提示 : 递 妇 暗 指 和 需要 许多 子 程序 的 调用 。 
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1. a) 地 址 一 一 00 01 10 11 
大 端 位 序 00 00 12 34 
小 端 位 序 34 12 00 00 


3. a) FE01e=1111 1110 0000 0001: 一 一 51lno 
b) O1FEs =0000 0001 1111 1110;=510% 

5. 提示 : 它们 在 不 同 的 处 理 器 上 运行 。 

7.6X224 

8. a) XYXWZXVUX 十 十 

13. 


立即 寻 址 
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18. a) 8 
b) 16 
€) 216 
d) 224 一 1 
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1. a) 220/24 一 216 
b) 20 位 地 址 中 ， 有 11 位 是 标记 域 ，5 位 是 块 域 以 及 4 位 是 字 域 。 
c) 22 块 
3. a) 216/25 一 211 
b) 16 位 地 址 中 ， 有 11 位 是 标记 域 ，5 位 是 字 域 。 
c) 因为 是 关联 高 速 缓 存 ， 所 以 可 以 映射 到 任何 地 方 。 
5. 每 个 地 址 有 27 位 ， 其 中 7 位 是 标记 域 ，14 位 是 组 域 ， 以 及 6 位 是 字 域 。 


13. ”程序 主 存储 器 
地 址 空间 地 址 空间 

0 0 

1 1 

2 

3 3 

4 | 4 

5 和 5 

6 6 

7 ¥ 





1. 提示 : 考虑 如 何 应 用 Amdahl 定律 。 
3. a) 选择 磁盘 升级 。 对 于 磁盘 ， 性 能 每 提升 1% 需 要 的 费用 是 216. 2 美元 ， 而 对 于 CPU 需要 的 费用 
是 268. 24 美元 。 E 
b) 磁盘 升级 产生 较 大 的 性 能 改进 : 磁盘 为 36. 99% ， 而 处 理 器 为 18. 64%。 
c) 收 支 平衡 点 是 采用 9922 美元 的 费用 进行 磁盘 升级 。 
5. a) 在 进入 某 个 中 断 服务 程序 之 前 ，CPU 应 该 禁止 所 有 中 断 ， 所 以 这 个 中 断根 本 就 不 应 该 发 生 。 
b) 不 是 问题 。 
c) 如 果 所 有 的 中 断 都 被 禁止 ， 那么 第 二 个 中 断 决 不 会 发 生 ， 所 以 这 不 是 问题 。 
11. 有 的 人 认为 从 某 个 特殊 的 磁盘 上 取 回 指定 的 数据 不 是 “随机 ”的 行为 。 
13. 旋转 时 延 (平均 反应 时 间 ) 二 4464RPM 二 74. 4rev/sec 一 0. 01344sec/rev 二 13. 44ms/rev。 (或 者 是 ， 
60 000ms/min/4464rev/min 二 13. 44ms/rev) 。 平 均值 是 整个 数值 的 一 半 ， 或 者 是 6. 72ms。 
15. 提示 : 考虑 磁盘 缓冲 器 的 影响 。 
17. a) 256MB (JMB=22B) 
b) llms 
19. 提示 : 要 考虑 取 回 时 间 和 存档 文件 要 求 的 存放 时 间 。 


第 7 章 专题 


5. 主机 适配器 通常 具有 最 高 的 设备 号 ， 因 此 主机 适配器 总 是 能 够 赢得 总 线 的 仲裁 “快速 和 宽带 ”的 
SCSI-3 接口 可 以 支持 多 达 3 个 设备 ， 所 以 ， 主 机 适配器 的 设备 号 总 是 为 32。 
11. 提示 : 除了 考虑 在 CPU 和 存储 器 之 间 传 输 字 节 数 据 外 ， 还 要 考虑 总 线 的 其 他 用 途 。 
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3. 提示 : 考虑 造成 不 可 预测 的 反应 时 间 的 一 些 事情 〈 例 如 ， 如 何 时 延 一 个 存储 器 的 访问 ?) 。 

5， 如 果 一 些 进程 共享 一 组 特定 的 资源 ， 那 么 合理 的 做 法 是 将 这 些 进 程 组 合成 一 个 子 系统 。 如 果 为 了 测 
试 这 个 系统 使 用 一 组 给 定 的 进程 ， 则 明智 的 做 法 是 把 这 些 进程 也 组 合成 一 个 子 系统 ， 就 好 像 这 些 进 
程 崩溃 或 反常 ， 只 有 运行 这 些 进程 的 子 系统 才 会 受到 影响 。 如 果 要 在 有 限 的 时 间 ， 或 用 有 限 的 资源 
访问 一 组 特定 的 人 群 ， 则 需 把 这 些 用 户 进 程 也 组 合成 一 个 子 系统 。 

7， 当 需要 对 代码 进行 更 多 的 压缩 时 ， 常 常 使 用 不 可 重新 定位 的 代码 。 因 此 ， 在 嵌 和 人 式 系统 中 ， 由 于 空 
间 的 限制 〈 例 如 ， 微 波 或 车 用 电脑 )， 这 种 情况 非常 普遍 。 不 可 重新 定位 的 代码 的 运行 速度 较 快 ， 
所 以 它 使 用 在 那些 对 很 小 的 时 序 时 延 都 非常 敏感 的 系统 〈 例 如 实时 系统 ) 中 。 可 重新 定位 的 代码 需 
要 有 硬件 的 支持 ， 因 此 ， 不 可 重新 定位 的 代码 适用 于 没有 这 种 硬件 支持 的 情况 〈 例 如 ， 任 天 堂 游戏 
机 ) 。 

9. 为 什么 动态 链接 节省 磁盘 空间 ， 产 生 较 少 的 系统 错误 以 及 允许 代码 共享 ” 然而 ， 动 态 链接 会 造成 装 
载 时 间 的 时 延 ， 而 且 如 果 动 态 链接 库 程 序 被 改变 ， 那 么 其 他 使 用 被 修改 库 的 程序 将 无 法 完成 库 的 链 
接 。 

19. 首先 将 Java 编译 成 字 节 代码 ， 然 后 利用 JVM 对 这 些 中 间 字 节 代 码 进 行 解释 。 

21. a) 如 果 出 现 不 同 的 计算 结果 (例如 ， 输出、 数据 变量 的 值 )， 这 些 结果 取决 于 特定 的 时 序 或 是 跨越 

一 些 独立 的 线程 、 进 程 或 事务 语句 的 执行 结果 的 顺序 ， 则 会 出 现 竞 争 条件 。 假 定 有 如 下 两 个 事 
务 ， 访 问 一 个 初始 结余 500 的 账户 : 

事务 A 事务 B 

获取 账户 余额 获取 账户 余额 

在 余额 中 加 上 100 从 余额 中 减 去 100 

存储 新 的 余额 存储 新 的 余额 

很 显然 ， 新 的 结余 值 取 决 于 两 个 事务 运行 的 顺序 。 对 于 新 的 账户 余额 ， 可 能 的 值 会 是 多 少 ? 

b) 通过 孤立 地 运行 各 个 事务 处 理 和 提供 原子 性 ， 可 以 防止 竞争 条 件 的 出 现 。 在 数据 库 中 ， 通 过 加 
锁 确 保 原 子 事务 处 理 。 

c) 采用 加 锁 可 能 会 导致 死 锁 。 假 定 事务 T1 在 数据 项 目 X 上 获得 一 个 专用 锁 (这 意味 着 其 他 事务 
不 可 以 共享 该 锁 )， 而 事务 T2 则 在 项 目 Y 上 获得 一 个 专用 锁 。 假 定 Tl 需要 占用 X 但 现在 却 需 
要 Y， 而 T2 必须 占用 立 但 现在 却 需要 X， 则 这 时 两 个 事务 都 会 一 直 等 待 对 方 ， 而 且 都 不 会 释 
放 它们 自己 拥有 的 锁 ， 因 此 发 生 了 死 锁 。 
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1.RISC 机 器 限制 只 有 装载 和 存储 指令 可 以 访问 存储 器 。 这 就 意味 着 所 有 的 其 他 指令 都 要 使 用 寄存 器 。 
这 样 要 求 较 少 的 指令 周期 ， 可 以 加 快 代码 的 执行 速度 ， 因 而 提高 硬件 的 性 能 。RISC 体系 结构 的 目 
标 是 实现 单 周期 指令 ， 而 当 指令 必须 访问 存储 器 而 不 是 寄存 器 时 ， 这 是 不 可 能 实现 的 。 

3.“ 精 简 ” 的 原意 是 提供 一 组 最 少 的 、 可 以 执行 所 有 基本 操作 的 指令 : 数据 移动 、ALU 操作 和 分 支 处 
理 。 然 而 ，RISC 体系 结构 现在 最 主要 的 目标 是 简化 指令 ， 便 于 加 快 指令 执行 的 速度 。 每 条 指令 只 
完成 一 种 操作 ， 所 有 指令 的 长 度 都 相同 ， 只 是 指令 布局 结构 有 所 不 同 ， 而 且 所 有 的 算术 运算 都 必须 
使 用 寄存 器 来 执行 〈 即 存储 器 中 的 数据 不 能 用 作为 操作 数 ) 。 

5. 128 

9. 在 关联 转换 过 程 中 ， 当 前 正在 执行 的 进程 的 所 有 信息 必须 被 保存 ， 其 中 包括 寄存 器 窗口 中 的 值 。 当 
保存 该 进程 时 ， 也 必须 保存 该 进程 的 寄存 器 窗口 的 值 。 进 程 信息 的 保存 取决 于 寄存 器 窗口 的 大 小 ， 
保存 存储 寄存 器 窗口 的 值 可 能 是 一 个 非常 费时 的 进程 。 
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11. a) SIMD: 单 指令 、 多 数据 。 一 个 特定 的 指令 执行 多 个 数据 。 例 如 ， 一 个 矢量 处 理 器 会 使 用 下 面 指 
令 来 进行 数组 相 加 : C [这 二 A [i] 十 B [ 癌 。 而 这 条 指令 可 以 对 几 个 数据 执行 : C [1] 二 A 
[1] +B [1], C [2 =A [2] +B [2j, C [3] =A [3] 十 B [3] 等 等 。 执 行 数据 的 数目 取 
决 于 处 理 器 中 包含 多 少 个 ALU。 

13. 松散 耦合 和 紧密 耦合 是 两 个 用 来 描述 多 处 理 器 如 何 处 理 存 储 器 的 术 诸 。 如 果 有 一 个 大 的 、 集 中 式 
的 和 共享 的 存储 器 ， 则 称 这 个 系统 是 紧密 耦合 的 。 如 果 有 多 个 分 布 在 不 同 物理 位 置 的 存储 器 ， 则 
认为 这 个 系统 是 松散 耦合 的 。 

17. SIMD: 数据 并 行 执行 ， MIMD: 控制 或 任务 并 行 执行 。 为 什么 ? 

19, 起 标量 处 理 器 既 取 决 于 硬件 〈 仲 裁 相 关 性 ) 又 取决 于 编译 器 〈 产 生 近 似 的 调度 安排 )，VLIW 处 理 
器 则 完全 取决 于 编译 器 。 因 此 ，VLIW 将 任务 的 复杂 性 完全 移 给 编译 器 。 

20. 这 两 种 体系 结构 都 配备 少量 数目 的 并 行 流水 线 来 处 理 指令 。 然 而 ，VLIW 体系 结构 依靠 编译 器 以 
一 种 正确 和 有 效 的 方式 来 预 包装 和 调度 指令 。 在 超标 量 体 系 结构 中 ， 指 令 的 调度 是 由 硬件 来 完成 。 

21. 分 布 式 系统 允许 共享 并 存在 元 余 。 

23. 如 果 在 一 个 交叉 (纵横) 互联 网 络 中 增加 处 理 器 ， 则 交叉 开关 的 数目 会 很 快 变 得 难以 管理 。 总 线 
网 络 就 会 出 现 潜在 的 瓶颈 和 争 用 的 问题 。 

25. 使 用 写 通 时 ， 新 值 会 立即 被 写 到 服务 器 。 这 样 总 是 可 以 保持 服务 器 处 于 最 新 状态 ， 但 是 写 操作 会 
占用 较 长 时 间 〈 这 样 会 损失 高 速 缓存 提升 的 处 理 速度 ) 。 而 使 用 回 写 时 ， 这 个 新 值 会 经 过 一 个 给 定 
的 时 延 后 才 流 向 服务 器 。 这 样 保持 了 服务 器 速度 的 提升 ， 但 是 这 也 意味 着 如 果 在 新 值 存 放 到 服务 
器 之 前 服务 器 发 生 了 崩溃 ， 数 据 就 会 丢失 。 这 是 一 个 很 好 的 例子 ， 它 说 明 性 能 增加 必须 要 付出 一 
定 的 代价 。 

27. 是 的 。 单 个 的 神经 元 会 接收 输入 、 处 理 输入 和 产生 输出 。 然 后 ， 另 外 一 个 神经 元 会 使 用 这 个 输出 ， 
按照 上 面 的 步骤 处 理 。 但 是 ， 这 些 神 经 元 本 身 是 以 并 行 的 方式 作业 的 。 

29. 当 神 经 网 络 正在 学 习 时 ， 错 误 的 输出 指示 用 于 对 网 络 中 的 权 值 进行 调整 。 这 些 调 整 基于 不 同 的 优 
化 算法 。 当 这 种 权重 平均 汇聚 到 某 个 给 定 的 数值 时 ， 该 学 习 过 程 完 成 。 | 
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1. 系统 C 执行 时 间 的 加 权 平 均值 为 : 2170/5=434， 因 此 ， 得 出 : (563. 5/434 一 1. 298387 一 1) X100 
二 30%。 系 统 A 的 性 能 已 经 下 降 : (9563. 5/79 一 1) X100 二 641.4%。 

3. 系统 A: 算术 平均 值 ==400; 几何 平均 值 : 1、0. 7712 和 1. 1364。 
系统 B， 算术 平均 值 王 525;， 几何 平均 值 : 1. 1596、1 和 1. 3663。 
系统 C: 算术 平均 值 王 405; 几何 平均 值 ，0. 7964、0, 6330 和 1。 

5， 提示: 使 用 调和 平均 数 。 

7. 这 是 不 完整 信息 的 雇 误 。 为 什么 ? 

9. 没有 这 种 比较 数值 。 因 为 每 个 版 本 的 基准 都 是 由 不 同 的 程序 组 成 ， 所 以 得 到 的 结果 不 能 够 进行 比 
较 。 

11. 在 这 种 情况 下 ， 最 好 的 基准 是 SPEC CPU 系列 。 为 什么 ? 

13. 首先 ， 这 是 一 种 外 交 辞 令 。 建 议 这 个 小 组 研究 TPC-C 基准 是 否 适 用 于 这 个 系统 。 无 论 TPC-C 的 数 
字 是 否 适 用 ， 都 需要 向 人 们 前 述 Amdahi 定律 的 意义 ， 以 及 为 什么 一 个 快速 的 CPU 不 一 定 能 够 决 
定 整个 系统 是 否 可 以 处 理 我 们 所 要 求 的 工作 量 。 

18. 提示 : 旋转 延迟 不 是 决定 磁盘 性 能 的 唯一 因素 。 

24. a) 5. 8 周期 /指令 
b) 5. 8MHz (为 什么 ?) 

c) 13. 25 
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5.TCP 报 文 段 的 有 效 载荷 〈 数 据 ) 应 该 尽 可 能 的 大 ， 这 样 可 以 将 发 送 这 个 报 文 段 所 需 的 网 络 开销 减 到 
最 小 。 如 果 有 效 载 荷 仅 由 1 或 2 个 字 节 组 成 ， 则 这 种 网 络 开销 比 数据 传输 至 少 要 大 一 个 数量 级 。 
7. 提示 : 回顾 TCP 报 文 段 格式 的 数据 偏 移 量 域 的 定义 。 
9. a) B 类 
b) C 类 
c) A 类 
11. a) 我 们 可 以 假定 在 TCP 或 全 报头 中 没有 设置 选项 ， 而 且 忽 略 任何 会 话 停 播 消息 。 在 TCP 报头 中 
有 20 个 字 节 ， 并 且 在 他 报头 中 也 有 20 个 字 节 。 对 于 一 个 1024 字 节 的 文件 ， 如 果 使 用 128 字 
节 的 有 效 载荷 ， 则 需要 传送 8 个 有 效 载荷 。 因此， 有 8 个 TCP 和 了 ? 报头 。 如 果 每 个 传输 单元 
需要 40 字 节 开销 ， 则 有 8X40 字 节 的 开销 加 上 1024 字 节 的 有 效 载荷 ， 总 的 传输 字 节 数 为 1344 
字 节 。 开 销 所 占 的 百分比 为 : 320 二 1344X100% 二 23. 8%。 

b) IPv6 报头 的 最 小 长 度 是 40 字 节 。 再 加 上 TCP 报头 中 的 ;20 字 节 ， 则 每 个 传输 都 包含 60 字 节 的 
开销 。 因 此 ， 要 发 送 8 个 有 效 载荷 ， 开 销 的 总 字 节 数 为 480 字 节 ; 开销 所 占 的 百分比 为 : 480 一 
1504X100% 王 31.9%。 

13. a) 1500 一 1599 字 节 
b) 1799 字 节 
2898 


LR 2898dB_ 
19. a) 信 品 比 (dB) = 三 10logio 40dB =18. 6dB 


b) 0. 32dB 一 10logo 信 各 外 => 信 号 dB=37. 68dB 





附录 和 A 


3. 一 个 更 有 效率 的 链接 表 的 实现 是 在 链表 中 的 每 个 节点 设置 3 个 指针 。 这 个 附加 指针 的 作用 是 什么 ? 
0 (A 





